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第 1 章指数密度与均匀密度 

1.1 引 言 


在本书第1卷中，我们反复讨论了由很多小项之和所定义的概率，并且利用下 
列形式的 逼近： 

P{o<X<6}« J f ( x ) dx . (1.1) 

一个最初的例子是二项分布的正态通近这类逼近通常以极限定理的形式来表述， 
该定理包含一系列越来越精细的离散概率模型.在许多情形下，通过这种极限在概 
念上引入一个新的样本空间，而后者在直观上可以比原来的离散模型更简单. 

例 （a) 指數型等待时间.为了用离散模型来表述等待时间，我们把时间离散化，并 
假定变化仅发生在时刻2<5,….最简单的等待时间 T, 是在具有成功概率 w 的伯 
努利 （Bernoulli) 试验序列中第一次成功的等待时间.于是 P{T > nJ} = (1 - p s ) n , 
等待时间的期望是 E(T) = 6/ p s . 这个模型的精确化，是在保持期望值 = a 不 

变的条件下让 <5减小而得到.在长度为 t 的时间内，相应地有 n » t/J 次试验,取对 
数后可以看出，当 <5很小时近似地有 

P{T > t} « (1 - 6/ a)^ s w e _t/Q . (1.2) 

该模型把等待时间作为几何分布的离散随机变董来研究，而 (1.2) 说明我们“依极 
限”得出一个指数分布.直观上看，似乎从以实数为元素的样本空间出发直接引入 
指数分布比较自然. 

例 （b) 随机选择.在区间中“随机地选择一点”是一个有明显直观意义的 
理想实验.它可用离散逼近来表述，但比较容易的是用整个区间作为样本空间，并 
指定每个子区间的长度为其概率.作两次独立的随机选择 Oji 中点的理想实验，得 
到一对 实数. 因此，自然的样本空间是一个单位正方形.在这种样本空间中，自然 
把“概率”和“ 面积- 同等看待.这样做对于某些基本目的是十分令人满意的，但是 
往后进一步就会产生“ ‘面积’究竟意味着什么”这种疑问. 


①更多的例子取自1第1卷 3.4 节中的反正弦 分布； 3.7 节中的返回 W 点次数和初过时间的 分布； 第14 
章中的随机游动的极限 定理； 11.7 节习 * 20中的均匀分布. 

® 关于术语 •■时 刻-的使用，参看本书的 ■•符 ，与约定•表. 

③区间是带有横线的，保留符号 ( a , 6) 表示平面上点的坐标.参考本书的•符号与约定■表. 
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这些例子表明，连续样本空间在概念上可以比离散模型简单，但是其上概率 
的定义却依赖于积分和测度论这类的工具.在可数样本空间中，可以对一切可想象 
的事件賦以概率，但在一般空间中，这一直觉的方式会导致逻辑上的矛盾，而我们 
的直观必须适应形式逻辑的要求.我们将很快看到，直觉的方法即使在相当简单的 
问题中也可能产生困难.恰当地说，许多有概率意义的问题不需要明确的概率定义. 
有时它们是具有分析特征的问题，而概率背景主要是作为对我们的直观的一种支 
撑.更为中肯的是，某些具有复杂样本空间的复杂随机过程可导致很有意思而且容 
易理解的 问题. 这些问题不依赖于在整个过程的分析中所用的巧妙工具.典型的论 
述如下：如果过程可以被完全地描述出来，则随机变董 Z 应当具有如此这般的性 
质，因此其分布应当满足如此这般的积分方程.虽然概率的论证能极大影响所述问 
题中方程的分析处理，但是在原则上后者与概率公理无关.各领域的专家们常常熟 
悉这类问题，对此他们不用测度论，因为他们不了解其他类型的问题和不严格论证 
所带来错误结果的情况 .® 

这种情况在本章（全书的非正式引论）中变得更明显了.它叙述了本书通篇将 
用到的两种重要分布的某些分析性质.本章也包括一些特殊论题，部分是由于它们 
的重要应用，部分是为了说明我们将要遇到的新问题和对适当工具的需求.但不必 
要系统地或按其出现順序去研究它们. 

在本章中，概率由初等积分定义，同时承认这个定义的局限性.概率论术语如 
随机 变童或 期望的使用，在两种意义下可认为是正当的.其一，与第1卷同等情况 
相似，它们可以解释成为直观的技术 助手； 其二，本章中的内容可以用逻辑上无缺 
陷的方式由 1.2 节例 （ a ) 所述的离散模型通过取极限来说明.虽然原则上既不必要 
又不值得追求，但后一方式为初学者提供了一个很好的练习机会. 

1.2 密度和卷积 

直线 (或 R 1 ) 上 的概率密度是 满足下列条件的函数/,使得 

/(*) ^ 0 ,广 /( i)dx = 1. (2.1) 

目前我们只考虑逐段连续密度 （一 般情况可参看 5.3 节).对于毎一密度/,它所对 

①严格和直 观两若 的作用 容易被 误解.如第1卷 枨出， 朴索的直观和朴索的思*是无力的，但 ft 它 
们随着败学理论的发展而增加了力量.今天的直观和应用依籟于昨天的 ft 难于理解的理论.而产格 
的理论加强了思维的效率.的确，经醱表明，在应用中大多数人依靠冗长的计算而不 ft 簡单的论 iE , 
因为这些论证看来是危 除的. （最恰当的说明在 1.5 节例⑷中 .） 
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应的分布函數® F 为 x 

Hx) = j X _J(y)Ay. ( 2 . 2 ) 

它是从0增加到1的单调连续函数.我们说/和 F 集中于区间 a < a ; < 6上， 
如果/在这区间外为 0. 密度/是作为直线上区间的概率的賦值而被研究.区间 
575 = {a < I < 6} 有概率 

F (6) — (2.3) 


这个概率有时用来表示.在这种賦值下，单点的概率是0,闭区间 
和^有相同的概率. 

在最简单的情形中，以实直线作为“样本空间”，也就是说，以数来表示理想 
实验的结果.（和第1卷一样，在表示实验序列的样本空间的建立中，这只是第一 
步 .） 随机变量是 定义在样本空间上的函数.为了简单起见，目前我们仅把这样的函 
数 J / 作为随机 变撤： 对于每一个 t , 它使事件 { J 7 < t } 由有限多个区间组成.于是 

G ( t ) = P{U < t }, (2.4) 

正好被定义为/在这些区间上的积分. (2.4) 定义的函数 G 称为的分 布函教 .如 
果 G 是函数 S 的积分，则 p 称为分布 G 的密度或变量 [/ 的密度. 

显然，基本随机变董是坐标变而所有其他随机变撤都是 X 的函数 . X 
的分布函数重合于定义概率的分布 F . 不用说，任一随机变鼇 F = g ( X ) 可作为一 
新直线上的坐标变量. 

上述这些术语，可用与第1卷情形的简单类比来说明其正确，但是下例表明， 
我们的模型可通过离散模型取极限而得到. 

例 （ a ) 数 据分组 .令 F 为一给定的分布函数_ 选一 固定的 d > 0,并考虑离散随 
机变董对于 ( n - lM < x $ n <5, A - 3 取常数值 n /5 •其中 n = 0,土1，±2,… •在第 
1卷中，我们用 <5的倍数作为样本空间，并以下式来描述的概率 分布： 

P { X 4 = n <5} = F ( ni )- F (( n - l ) S ). (2.5) 

现在 Xs 变成扩大的样本空间中的随机变童，它的分布函数当 nS ^ x < (n + l )5 时 
等于 F ( n 6 ). 在连续模型中，作为 X 的近似 ，叉 是把区间与其右端点等同起来 

①所谓•分布函败’是指在±00处具有极 K 0和1的右连读非败.第1卷主要讨论了其增长 
跃式的分布.现在我们把注意力集中在分布函败上，它由积分来定义. HR 的分布在第5章砑究. 
® 我们尽可能用大写字母来表示随机变量（即样本空间上的 a 数)，用小写字母表示数或位 置参数 .犄 
别地，这对于坐标变量 X ,即函 ft X(x) = X也是适合的. 
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而得到的（统计学家知道，该方法是作数据分组用的).根据第1卷的精神，我们把 
X S 作为基本随机变童，把 <5作为自由参数来处理.令 d — 0,由极限定理得知 ， F 
的极限分布. 

例 （ b ) 对于 i >0, 事件{ X 2 < a :} 和事件 

{— y/x ( X ( \/ x } 

相同；随机变 MX 2 有一个集中在0^5上的分布，它由 

F ( y / x )- F {- y / x ) 

给出.微分后可见， X 2 的密度 S 为 

\ J [/(^) + /(- V 5)]/^. 当 z >0 时， 
a ( x ) = < 2 

{ 0, 当 I < 0时. 

X 3 的分布函数对所有0：由 F {^ x ) 给出，它的密度为 
|/(卿设. 

X 的期 IS ( expection ) 定义为 

E(X) = J + °°xf(x)dx, (2.6) 

但是要求积分绝对收敛•例 （ a ) 的近似离散变 M 的期望与它的积分的黎曼 ( Rie - 
maim ) 和相同，因此 E (^,) - E ( X ). 如果 u 是一有界连续函数，则同样的论证适 
用于随机变量 u { X ), 关系式 E ( u ( X 4 )) - E ( u (_ Y )) 蕴含 

E ( w ( X )) = J u (®)/( x ) dx ; (2.7) 

微妙之处在于这个公式不明显地利用 u ( X ) 的分布.于是，只要知道了随机变童 X 
的分布就完全可以算出它的函数的期望. 

X 的二阶矩 (second moment ) 定义为 

E ( X 2 ) = J*°°x 2 f{x)dx, (2.8) 

只要积分收敛.令 /i = E ( X ), X 的方差又定义为 

Var(X) = E((X-/i) 2 ) = E ( X 2 )-^. (2.9) 
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注 如果变 挝X是正的 (即密度/集中在5^3)，且 （2.6) 式中积分发散，为了方便 
则说 X有无穷 期望，记作 E ( X ) = oo . 同样，当 (2.8) 式中积分发散时，我 们说叉 
有无穷 方差.对于取正值与负值的变 M , 在积分 （2.6) 发散时，期望没有 定义. 一个 
典型的例子由密度 ^(l + i 2 )- 1 给出. 

密度的概念可以转用于高维空间中，但是一般的讨论放在第3章.在那之前， 
我们将仅考虑第1卷 5.4 节所引入的乘积概率的类似概念，以便描述独立实验的组 
合.换句话说，在本聿中我们仅讨论形如 mg ( y ), f ( x ) g ( y ) h ( z ) 等的乘积密度，此 
处/, 3,…是直线上的 密度. 给定 R 2 平面上形如 f ( x ) g ( y ) 的密度就意味着“概率” 
与下列积分等同 | 

p { A } = JJ a f ( x ) g ( y ) dxdy . (2.10) 

“ 两个具有密度 f 和 g 的独立随机变量 A ■和 y " 的说法，意味着在 ( X , Y ) 平面 
上由 (2.10) 给出 概率. 它级含区间的乘法法则，例如 P{X > a,Y > 6} = P{X > 
a } P{K > 6}. 它与离散的情形是如此相似，以致不需作进一步说明. 

许多新的随机变撤可定义为 A ■和 F 的函数，但最起作用的还是和 S = X + Y . 
事件 A = {S < «} 可由使 x + y ^ s 成立的点 ( x , y ) 组成的半平面来表示.以 G 表 
示 K 的分布函数，因此有 ff ( v ) = G '{ y ). 为了得出 X + Y 的分布 A 教，在式 (2.10) 
中，在1/< a _ a : 上积分得到 

P{X + y 厂 G(s - x ) f { x ) dx . (2.11) 

由于对称性， F 与 G 所处地位可以交换，而不影响其结果.微分可见，尤 + F 的密 
度由下列两秩分中任一个给出 t 

r+oo r+oo 

J f (8 - V ) g ( V)dy = j f ( v ) g(a - y ) dy . (2.12) 

上式定义的运算是 5.4 节所导出的卷积的特殊 情形. 目前我们仅对密度利用卷 
积这一术语 | 两个密度 / 和的卷积是一个由 （2.12) 所定义的函數，以表示. 

整个第1卷处理的是离散分布的卷积，且法则是相同的•依 (2.12) 有/* 9 = P /. 
给定第3个密度 h , 我们可作出 { f * g )* h , 这是3个分别具有密度/，& h 的独立 
变 董之和 x + y + z 的 密度. 随机变贵求和的可交换性与可结合性，里含卷积的同 
祥性质，因此/ * J ； * /»与运算顺序无关. 

正 值随机变量起 着重要作用,因此指出下面一点是有益的， 即如果 / 和 S 集 
中在5^上，則式 (2.12) 的卷积 f * g 就化为 

/ / - y ) g ( y)dy = [ f ( x ) g(a - *) dx . (2.13) 

Jo Jo 
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例⑷令/和 5 集中在 0^S±, 且定义/ ㈤ = oe - a * 和!; (*) =决―气则 

e - a * _ e -0x 

f* g{x) = a0 ― 这二 a —， x >0. (2.14) 

当 a = /? 时，规定 / * 5(*) = a 2 xe - Q *. (在习题12中继续讨论 •） ► 

关于随机变量槪念的注 用直线或笛卡儿空间 R " 作为样本空间，经常会使随机 
变量与一元或多元“普通”函数间的区别模糊起来.在第1卷中，随机变量 X 仅取 
可数多个值，于是，不论是讲定义在直线上的函数（如二次函数或指数函数)，还是 
讲定义在样本空间中的随机变董 X 2 或其含义都是明显的.甚至这些函数的表 
现特征也是完全不同的，因为“普通”指数函数的值域是正实数集，而 e x 的值域 
只有可数个数.为了看清其中的变化，现在来考虑“两个具有共同密度/的独立随 
机变量 X 和 V ” . 换句话说，平面 R 2 作为样本空间，概率定义为 f{x)f(y ) 的积 
分.现在每一个二元函数均可在样本空间中定义，因此它是一随机变 M , 但须记住， 
二元函数也可以与我们的样本空间无关地 定义. 例如，某些统计学问题迫使人们引 
入随机变贵 /( X )/( y ) [参阅 6 J 2 节例 （ d )]. 另一方面，在引入样本空间 R 2 时，我 
们显然已注意到与样本空间无关的“普通”函数，由该“普通”函数可得到许多随 
机变贵，即 f(X), f(Y),f(X±Y) 等等.因此，同一个/既可作为随机变董，又可 
作为普通函数. 

通常（和在每一特殊情形中）我们是否涉及随机变量是容易看出的.但是，在一 
般理论中，会出现这样的情况，其中一些函数（如条件概率和条件期望）既能看作 
普通函数，又能看作随机变 M , 而且，如果对选择的自由没有正确的理解，则就会 
引起混乱. 

关于术 i § 和记号的注释为了不使语句过长，习惯上也可以称 Epr ) 为变鼉 A •、密度/或 
分布 F 的期望.其他术语的称呼也可类似对待.例如，卷积实际上表示一种运算，但是该 
术语也可用于运算的结果，且称函数 / *» 为“卷积》 . 

在早期的文献中，分布和频率函数等术语适用于我们称为密度之处；我们的分布函败 
被描述为"累 积- 分布函数，而且简写符号 c . d . f . 仍然沿用. 

1.3 指数密度 

对任意固定的 a >0,令 

f(x) = ae - QX , F (*) = 1 - e - QI , 当 a :>0 时； (3.1) 


且当 a : < 0 时 F(x) = f(x) = 0 ■于是 / 为一指数密度， F 是其分布函数.简单的计 
算表明，期望等于 a - 1 , 方差等于 
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在 1.1 节例 （ a ) 中，指数分布作为几何分布的极限被得到， 1.2 节例 （ a ) 的方法 
导致相同的结果.回忆在随机过程中，几何分布经常支配着等待时间或寿命，而且 
这是由于在第1卷 13.9 节所说的它“无记忆性” 的缘故 •• 不管现在的年龄是多少， 
剩余的寿命与过去无关，且其分布和整个寿命的分布相同.现在来证明，该性质仅 
可搬到指数极限分布而不能搬到其他分布上去. 

令 T 表示寿命或等待时间的任一正变量. 用足部 


U(t) = P{T > f } (3.2) 

来代替了的分布函数是方便的.直观上， £/( t ) 是•■寿命超过 t 的概率”.巳知年龄 
为8, 刺余寿命超过 t 的事件和事件 { r >5+ t } 相同，该事件（在已知年龄为 S ) 的 
条件概率等于比值 外 这是刺余寿命的分布，为使它与整个寿命的分布 
相同，当且仅当 

U(8 + <) = U(s)U(t), a,t>0 (3.3) 

在第1卷 17.6 节中已经证明，该方程的正值解必定具有形式 t /(4) = e - at . 因此， 
如果寿命的分布是指数分布，則上面所述的无记忆性仍然成立. 

我们将把这种无记忆性称为指数分布的马 尔可夫 （ Markov ) 性.用分析的说法 
是，只有指数分布 F 的尾部 U = l-F 才满足式 (3.3), 它说明指数分布在马尔可 
夫过程中经常出现的原因.（马尔可夫性更强的形式将在 1.6 节叙述 .） 我们的描述 
涉及时间，但论证是一般的，当时间换为其他参数时，马尔可夫性仍然是有意义的. 
例 （ a ) 抗张强度.为了得出著名的有限链条的连续模拟，链的强度是指它最薄弱 
环节的强度，用 £/( t ) 表示（由某种材料制成的）长度为 t 的线段可以承受某一固定 
负荷这一亊件的概率.为使长为 s + * 的线不突然折断，当且仅当线的两段分别都 
能承受给定的负荷.假定没有相互作用，这两个事件应当看作是独立的，因而 V ( t ) 
必须满足式 (3.3). 其中线长充当了时间参数的角色，线折断时的长度是一个有指 
数分布的随机变量. 

例 （ b ) 空间 中的随机点鲜 在许多方面起作用，因此，对这概念给以适当定义是重 
要的•直观上讲，完全随机性这个首要的性质就是在不同区域中没有相互作用：区 
域4内观察到的情况，不能给出与其不相交区域>1 2 内点群的结论.特别地， 

和皆空的概率 P 等于为空的概率与为空的概率 pa 之积. 这个乘法 
法则对于所有区域的划分不可能成立，除非概率 P 仅依赖于区域4的体积而不依 
赖于它的 形状. 如果情况确实如此，则用 V ⑴表示体积为 < 的区域不含点的概率， 
它满足式（3.3)，因此 y ( t ) = e - Q * ; 常数《依赖于点群的密度，或等价地依赖于长 
度的单位.下一节将指出的这一知识能使我们算出体积为 t 的区域恰好包含 
点群的 n 个点的概率；它由泊松 （ Poisson ) 分布 p n (t) = e _ at ( crt ) n / n 〖 给出.因此， 
我们称之为泊松点群，这一术语比有其他内容的随机点群的术语更确切一些. 
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例 （ c ) 圓和球的群体. 质点的随机群体提出一个更复杂的问题.为了简单起见， 
假定质点是球形或圆形的，半径 P 固定.于是它的组成完全由圆(球）心所决定，且 
假定这些圆心形成泊松点群.虽然这在严格意义上是不可能的，因为圆心的相互拒 
离必须大于 2 p . 但是我们仍然认为，对于小的半径 P , 有限尺寸的影响在实际中可 
以忽略，因此圆心的泊松点群模型作为近似是可行的. 

作为数学模型，我们假定圆心形成泊松点群，并默认圆或球相交的可能性.如 
果半径 P 是小的，则这一理想化将无实际效果，因为此时相交的理论频率可以忽 
略.因此，天文学家把星球系统当作泊松点群来处理，这个近似在实际中看来是极 
好的，下述两例表明在实际中如何利用此模型. 

例 （ d ) 最近的邻城. 我们研究具有密度《的球（星）的泊松点群.体积为 t 的区域 
内不含圆心的概率等于 e - Qt . “原点到其最近邻域的距离大于 f ” 等价于“半径为 
r 的球的内部不含星球中心' 这样的球的体积等于因此在星球的泊松点群 
中，最近邻域的距离大于 r 的概率为 e - t ^ 3 . 这一表达式与星球半径 p 无关的事 
实，表明模型的近似特征和它的局限性. 

在平面上，球换为圆，最近邻域的距离的分布函数为 
例 （ e ) 继 读讨论 I 自由 路程. 为了叙述方便，我们从二维模型开始.圆盘的随机 
点群可以解释为稀疏森林的横截面.我站在原点（它不包含在任何圆盘中)，看着正 
x 轴方向.与任一圆盘不相交的最长区间町表示視野 ( visibility ) 或 a : 方向上的自 
由路程.它是一个随机变 M , 我们以 I 表示. 

用4表示由这样一些点组成的区域，它与； c 轴上区间 P 的某点的距离小于 
或等千乂的边界由直线 y = ± p 上的两条线段0彡 a : 彡 t 和两个分别以原点和点 
( t ,0) 为圆心 p 为半径的圆组成.因此>1的面积等于 2 pt + n f y 1 . 为使事件 {L > f } 
发生，当且仅当没有一个圆盘的中心包含在4的内部，但是事先已经知道，以原点 
为中心、 P 为半径的圆是没 有的. 其余的区域的面积是2 〆 ，因此我们断定，视野 L 
的分布是指数 分布； 


P{L > t } = e -20 ^. 

在空间中，可用同样的论证，并且有关的区域可由 A 绕 rc 轴旋转而成.矩形 
0 < a : < t , | i /| < p 换成体积为的圆柱体.我们断言，在球形星的泊松点 
群中，任何方向的自由路程 L 有捎数 分布： P{L > 0 = 卿 \平均自由路程为 
E(L) = l/tiiap 2 ). ► 

下面这个定理将被反复应用. 

定理如果 X u - -, X n 是具有指數分布 （3.1) 的相互独立随机变 t , 則和 X t + 
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9n(x) = a ^3 ijT e_aX * ® > 0 ， (3.4) 

= + 罟 + …+ ^^)， x>0. (3.5) 

证对于 n = l , 结论化为定义 (3.1). 密度 g n+1 由下面卷积 定义， 

9n+i(t) = j g n (t - x)gi(x)dx. (3.6) 

假定 (3.4) 成立，于是得到 

一 ) =扫广/ 1 "、=。聲 〆 . （ 3 . 7 ) 

因此，由归纳法可知， (3.4) 对所有的 n 成立. 由微分可得 (3.5). ► 

密度％ 是2. 2 节所引入的 r 密度.它们表示负二项分布的类似连续分布，负 
二项分布在第1卷 6.8 节中是由具有相同几何分布的 n 个变量之和求出的.（参看 
习题 6.) 
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以…表示具有共同指数分布 （3.1) 的相互独立随机变撅，令 So =0, 

S n =^ Xi + + X„, n = l ，2, …. (4.1) 

我们引进一个新的随机变 M 族 iv ⑷： N ⑺是使& < t 的指标 fc > 1的 个数. 事件 
Wt) = n } 发生，当且仅当 S „ < t , 同时 S n+J > t . 当有分布 G „ 时，该事件的 
概率等于0„(«)-<?„ +1 ⑷，或者 

P{iV(«) = n} = e- ot ^. (4.2) 

用语言表示，随机变量 _ 有期望为 crt 的泊松分布. 

这一论证看来好像是泊松分布的新推导，但是实际上只是用随机变量的术语 
来重新叙述第1卷 6.6 节的原来 推导. 为了直观起见，考虑偁然发生的事件（如宇 
宙线大董出现或电话铃响)，我们把它称为••到 达”. 假定它是无后效的，即过去的 
历史无助于断定 将来. 如我们已经看到的那样，这个条件要求第一次到达的等待时 
间是指数分布.但是在每一次到达后的过程又按全过程的概率规律重新开始， 
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两次到达之间的等待时间 X * 必须独立且有相同分布.和 S „ 表示第 n 次到达的时 
刻， JV ⑷是在区间取中到达的 次數. 在这一论证中，与泊松分布的原有推导不同 
之处，仅在于利用了较好的专门术语. 

(在随机过程的术语中，序列 { S „} 构成了一个具有指数间隔时间：^的更新过 
程，其一般概念请参看 6.6 节 •） 

甚至这种简单情形也会出现明显的矛盾，它说明需要一种完善的方法，下面我 
们用一种自然的方式来叙述. 

例等待时间的悻论.公共汽车依泊松过程而到达，依次相继而来的汽车间隔的期 
望时间是 a ' 1 . 我在时刻 t 到达.问我等待下一辆汽车的时间呢的期望 E ( Wt ) 是 
多少？（当然，我到达的时刻*与汽车无关，例如正中午 •） 以下两个不同的解答都 
是有道理的. 

( a ) 泊松过程的无记忆性，蕴含着我的等待时间分布不依赖于我的到达时刻. 
在这种情形下， E ( W t ) = E ( Wb ) = a - 1 . 

( b ) 我的到达时刻是“随机地出现”在区间 内的. 在两辆接连而来的汽车中间， 
由于对称 p , 我的期望等待时间是两辆接连而来的汽车间隔期望时间的一半，即 
EW ) = - a - 1 . 

两个论证看来都是合理的，并且都被用丁•实际中.然而该矛盾将如何解释呢？ 
最容易的是形式主义者的办法，他们拒绝去看淸一个不是以完满的方式来陈述的 
问题.但是问题并不能因忽视而被解决. 

现在我们指出这两个论证在本质上（如果不是形式上）是正确的.矛盾在于意 
料不到的地方，下面来说明这一点 .® 

我们讨论间隔时间& = Si,X 2 = 5 2 - Si , -- 根据假定， X * 有相同的指数分 
布， 其期望为 a - 1 . 选取••任一”特殊的 Xfc 就得到一个随机变量，我们从直观上会 
认为它的期望为^ 1 ,只要这种选择不箱要用到样本序列 ••的 知识.但这 
是不正确的.在本例中，我们选择一个元素使得 

Sk-i <t^ Sk, 

其中 f 是固定的.这个是不考虑实际过程而作出的选择，但是这样选出的 Xfc 有二 
倍的期望 2 a - 1 . 考虑这一事实，本例的论证 ( b ) 假设有期望等待时间 CT 1 , 于是矛 
盾消失. 

这个悖论的解决引起了有经验的工作者们的震动，但是，我们的思考方式一经 
适当调整，它在直观上就变成明显的了.粗略地说，长区间比短区间有较多的覆盖 
t 点的机会.这一含糊的直觉被下列命题所证明. 

'①关于各种悖论参看 6.7 节« (a). 悖论也产生于一舨更新理论中，在它们被充全理解之前，它们 曾 
引起严重的困难和矛盾.有关的基本理论参# 11.4 节. 
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命题令^，右， •■相 互独立，有相同的期望为 a - 1 的指教分布.令*>0是任意 
固定的， 則滿足条件 Sm < t 彡 St 的变量 Xk 有密度 


Vt (®) 



a(l + at ) e ' 


当0 < a : < f 时， 
当 : c > * 时. 


(4-3) 


关键在于密度 （4.3) 不是 Xfc 的共同密度.它的明显形式是不重要的.（任意等待 
时间分布的类似情况包含在 11.4 节式 （4.16) 中 .） 

证令*:是使 S*— < t <氏的（依赖于随机性的）下标，令 L t 等于馬 - 灸 ^.我 
们证明有密度 (4.3). 首先设 x < t . 为使事件 {Lt < z} 发生，当且仅当对于某 
一组数 n , y 同时有 5 n = y 和 t _ i /< X n+ i < I . 这需要 


对所有可能的 n 和 y 求和，得到 

P{I t “、 H 9n(y) - - e-~]dy. (4.4) 

但是， 讥 ( V )+ S 2( I /)+ ••• = £» 是恒等式，因此 

P { L t < i} = 1 - e~ ax - axe- Q *. (4.5) 


经微分，对于 a : < t 我们得到 (4.3). 对于 a : > t ，除了 y 的值域是0到 t 这一点之 
外，其余可用类似的论证，同时我们应当把亊件0 < t <负< a : 的概率 e - Qt - e - Q * 
加到 (4.4) 的右端.证毕. ► 

公式 (4.3) 在 z = f 处的间断是由于作为过程开始时刻的原点的特殊作用.显 
然， 


^lim = a 2 xe ~' 


(4.6) 


它表明原点的作用消失了，因而对于“老”的过程， L t 的分布几乎与 t 无关.我们 
把这一事实用 I t 的“穗定状态”密度表示，它由 (4.6) 右端给出. 

用证明中的符号，本例中所考虑的等待时间 m 是随机变贵 m = S k - t . 论证 
还证明了 


P{Wi <x} = e-^- e~ a < 1+ *) + V T - e 〜 ( s+ *_ 叫 dy 


(4-7) 


因此，按照论证⑷， Wi 和久 * 有相同的指數分布.（参看习题 7.) 
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最后介 绍泊松 过程.泊松变量 N(t) 作为随机变量无穷序列 Xi,X 2 , - - 的样本 
空间上的函数而引入.这一方式能满意地适合于很多用途，但是，一个不同的样本 
空间是更为自然的.“观察直至时刻 * 来到的呼叫次数”的理想实验，对于每一正 
数 t 得到一个整数，因而结果是一个跃度为1的阶梯函数.相应的样本空间是以这 
些阶梯函数作为样本点的空间；它是一个函数空间——所有可能“轨道”组成的 
空间.在这个空间中， JV ( t ) 定义为时刻 t 处的纵坐标，定义为第 n 次跳跃的横 
坐标，等等.现在可以考虑不易用原先的变量 X „ 表达的事件.一个有实际意义的 
典型例子（参看 6.5 节中的破产问题)是对于某一 t , N ( t ) > a + 6 t 的事件.一条轨 
道（正如二项试验中±1的一个无穷序列一样）代表自然的而不可避免的概率研究 
对象.我们-■旦习惯了这个新术语，轨道空间就变得极为直观了. 

遗憾的是，在样本轨道空间中概率的引入远不是简单的亊情.比较起来，一步 
步地从离散样本空间到直线、平面等，甚至到随机变量的无穷序列，在概念上和技 
术上都不 困难. 新的问题是和函数空间有关而产生的，在此我们吿诉读者，在本书 
中不讨论这类问题.我们将满足于序列样本空间（可数多个坐标变贵）的简单论述. 
一般地提到随机过程或特殊地提到泊松过程都是很随意的，它仅仅提供直观背景 
或增加我们问题的趣味性. 

泊松点群 

如第1卷 6.6 节所指出，泊松分布律不但支配了 “在时间轴上随机分布的点”， 
而且还支配着在平面上或空间中随机分布的点群（如材料中的裂纹或蛋糕中的葡萄 
干)，只要把 < 解释为面积或体积.一个基本假设是，在指定的区域中有 fc 个点的概 
率只依赖于区域的面积或体积，而不依赖于它的形状，并且在不相交的区域中的出 
现是独立的.在 1.3 节例 （ b ) 中，我们利用同一假设证明了体积为 < 的区域中不含 
点的概率是 ( T 1 * 4 . 这相当于第一个事件发生的等待时间的指数分布.现在看到，对 
于事件个数来说，泊松分布是它的直接 推论. 同一论证适用于空间中的随机点群, 
于是我们有如下事实的一个新证明：包含在给定区域中的点群的点数是一个泊松 
变最. 形式上的简单计算可得到随机点群的有趣结果，但是关于泊松过程的论述同 
样适用于泊松 点群； 完整的概率描述是复杂的，而且超出本书的范围. 


1.5 倒霉事的持续时间 

众所周知，排队肯定要等上一段时间，而类似这样的倒霉事是我们经常会碰到 
的. 概率论能为解释这类问题作出多大的贡献呢？为了得到部分答案，考虑三个对 
各种情况是典型的例子•它们说明了随机起伏的不可预料的一般特点. 

例 （ a ) 记录值•以表示我在某一随机事件上的等待时间（或金钱损失).设我 
的朋友们也在经历同类的事情，其结果用 A !， X 2 , …来 表示. 为了消除偏倚，假定 
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X 0 , X u … 是相互独立且具有共同分布的随机变童.这种分布的性质实际上无关紧 
要，但是，因为指数分布可作为随机性模型，依 (3.1) 我们假定 X ,是具有指数分布 
的.为了叙述简单，我们把序列 { Xj } 当作无穷序列来处理. 

为了寻求我的倒霉事的度 M , 我问，在某一个朋友碰到倒霉事之前，我的倒霉 
事要持续多久（忽略了使& = 的零概率事件).此外，在形式上，引入等待时 
间 汉作为 使1„ > X 0 的第一个下标 n 的值. 事件{汉 > n - l } 发生，当且仅当 
n 元组的最大项出现在最初的位置上.由于对称性， 这事 件的概 
率是事件 {JV = n } 和事件 { N > n - l }-{ N > n } 是相同的，因此，对于 
n = 1，2,…， 

P{N = n } = ---^— = - r ^—. (5.1) 

n n +1 ra(n + 1) ' 

这个结果完全证实了我确实很 倒霉： 随机变董 W 有无穷期望！ 对于解决我的倒 
霉记录而言，如果平均要做1000次实验，这已经是足够坏了，更何况实际等待时 
间有无穷期望. 

注意，论证不依赖于 X * 是指数分布这一 条件. 由此推出，只要 Xfc 独立且有 
共同的连续分布函数则第一个记录值有分布 (5.1). 这分布不依赖于 F 的事实， 
被统计学家用来检验独立性.（参看习题8 〜 习题 11) 

结果 （ 5.1) 的严格而又一般的性质同证明的简便联系在一起，容易引起人们 
的 怀疑. 实际上论证是无缺点的（除了叙述的简便外).但是，那些宁愿信赖烦琐计 
算的人，由上述概率直接定义，求 a n +1 e -°(-»+- + *-) 在不等式0 < 吻< ; c „ 和 
0 < 而 < ®o(i = 1 ， ... ， n_ 1) 所确定的区域上的 (n+1) 重积分，能够容易验证 (5.1) 
的正确性. 

(5.1) 的另一推导是对条件概率的有益练习；它虽然难一些，但是可得出 另夕卜 
的结果（习题 8 )•给定 X 0 = z , 以后各次实验中取较大值的概率是 p = e -«, 我们 
讨论的是具有概率 P 的伯努利试验中第一次成功的等待 时间. 因此， 在 X 0 = x 条 
件下 ;V = n 的条件概率是 p(l - p )"- 1 . 为了得到 P[N = n }, 我们乘以事先的假设 
X 0 = x 的密度 ae -«, 并对 a : 积分.代换1 - e ~ a * = t , 被积函数变为产_ 1 (1 - *), 
它的积分等于 n - 1 - ( n +1)- 1 , 这与 (5.1) 一致. 

例 （ b > 比. 如果 X 和 F 是两个具有相同指数分布的独立变量，则比 Y / X 是一 
个新的随机变董.它的分希函数由 a 2 e - Q (-+») 在 0< y < te ,0< a ;< oo 上积分得 
出.对2/积分得到 

P { Y/X ^ t }= r ae-°*(l - e- ate )di = (5.2) 

Jo 1 +1 

相应的密度为 (l + i )~ 2 . 值得注意的是， 变 f Y/X 有无穷 期望. 
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这里我们找到了令人不快事件的持续性的一个新证明.实际上，如果彼得的等 
待时间比保罗长3倍，彼得有理由感到委屈，但是分布 (5.2) 賦予这事件的概率是 
1/4. 由此推出，平均地说，保罗或彼得二者之一都有理由感到委屈.由于很短的等 
待时间容易被忽略.所以在实际上要增加观察次数. 

例 （ c ) 并行的等待线. 我开着车到达汽车检査站（或进入隧道的入口、汽车的轮 
渡口，等等).有两条等待线可供选择，但是我一旦选择一条，就不能再换.跑在我 
后面的史密斯出现在我也许该选择的地方，我一直注意他是在我前面还是后面.队 
伍大部分时间停着，偶尔某条等待线向前运动一个车身.为了使纯随机性的影响最 
大， 假定两等待线随机 独立； 此外，两个接连的运动之间的时间间隔是具有相同指 
数分布的独立变贵.在这些情况下，接连运动构成一个贝努利试验，其中“成功” 
表示我在前,“失败”表示史密斯 在前. 成功概率是1/2,这在本质上说明我们所讨 
论的是对称随机游动，它的奇妙的起伏性质获得清楚的解释（为了叙述简单，不顾 
仅有有限辆汽车这一现实情况).我能否跑到史密斯的前面呢？用随机游动的说法， 
问题就是《第一次通过+1能否发生.如我们所知，这事件的概率是1,但其期望等 
待时间是无穷.这种等待给了我对不快亊件感到惋惜的充足理由，并且由于史密斯 
用同法讨论而更加令人不愉快. 


1.6 等待时间与顺序统计置 

有序的 n 元实数 ( x ir --, x n ) 可以按照数值增加的顺序重新排列，得到一个新 
的 n 元组 

(*(1).*(3)> •••.*(»«)). 其中 *(1) <1(2) < ... 《*(»»)• 

适用于空间 R " 中一切点的这一运算,导出了 n 个完全确定的函数，以 X ⑴, • • -, X (n) 
表示.如果概率定义在 R n 中，则这些函数就成为随机变世.我们说 (X ⑴，…，义<„)) 
是由 ( X u ---, X n ) 按数值的增加重新排列而得到.变贵 X ( fc ) 称为给定样本 A ，…， 
的第 fc 个順序统计妒. 特别地 ，X⑴和 X ( n ) 是样本 极值； 当 n = 2 i / + 1为奇 
数时， X {v+1) 是样本中位数 • 

我们把这个概念应用于具有相同指数密度 ae - 1 * 的独立随机变量 X u ."， X n 
的特殊情形. 

①严格地说，术语 •样本 统计量•是•样本变*的 函败” 的同义语，即是随机变 M . 从语言上讲，它 
的使用是为了强调 版来变 s (样本）和某费导出变量在给定范 a 内所起的不同作用•例如•样本平 
均 -(Xi + • • • + X „)/ n 可 ft ： 为统计量_顺序统计*经常出现在统计学文歒中.我们沿用标准术语， 
除了极端值通常称为极 •值 • 这一例外. 
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例 （ a ) 并行的等 待线. 把1„解释为有 n 个柜台的邮局从时刻0开始的 
n 次服务时间的长度. 顺序 统计量表示服务结束所接连发生的时刻，或者说， 接连 
解除服务的时 刻（“输出过程 ”）. 特别地 ，X ⑴ 是首次解除服务的等待时间.现在如 
果假定无后效是有意义的，则等待时间 X ⑴ 应具有马尔可夫性，即 X ⑴ 必须是指 
数分布的.事实上，事件 { X (1) > t } 发生等于 n 个事件 { X * > t } 同时发生，其中每 
个亊件有概率 e - 由于假定了独立性，概率相乘，可得 

P{X ⑴ >«} = e _nQt . (6.1) 

现在我们可以再深入一步，研究在时刻 X ⑴ 的情况.缺乏记忆性的假定看 
来可导出初始情况的再现，除非现在只有 n -1 个柜台在 工作； 过程的后延是与 
X (1> 独立的， 并且是全过程的复制品（再现).特别地，下一次解除服务的等待时间， 
⑴， 将有分布 


P { X (2) - X ⑴ > t }= e -("-” ot ， (6.2) 

它与 (6.1) 相类似.这一论证导致下面关于有相同指数分布的独立变 M 的顺序统计 
童的一般命题. 

命 B ① TJ 个变董 ■⑴， X (2) — X ⑴，…，尤 ( n )- X ( n -” 是社立的，而且 X ( fc +1) — 尤⑻ 
的密度为 （n - A :) ae - (n -* )ot . 

在验证这个命题之前，我们先从形式上考虑它的含义.当 n = 2时，差- 
X ⑴ 是在两个等待时间中较短者结束后的剩余等待 时间. 命题断言，这个剩余等 
待时间和原来的等待时间有相同的指数分布，并且与 独立. 这是由依赖于 ® 
定时刻 < 所表现的马尔可夫性，到依賴于随机的停止时间 X ⑴ 的马尔可夫性的推 
广.称它为强马尔可夫性.（若讨论的仅是有穷多个变量，则能由弱马尔可夫性导出 
强马尔可夫性，但是在较复杂的随机过程中，差别是主要的 .） 

命題的证明可作为积分练习的例子.为了术语简单，我们令 n = 3. 和许多情 
形类似，利用对称性论证.在变量；^中没有任何两个变董相等的概率为 1. 因此， 
忽略概率为零的事件，依照数值大小而有的6种可能排列，它表示6 
个等概率的互斥事件.因此，为了计算顺序统计 M 的分布，只要考虑一个随机事件 
Xi < X 2 < x 3 即可. 于是 

P { X (1) > tl ， X (2) —义(1) > *2， x (3) —尤(2) > fe } 

= 6 P{Xi > t u X 2 - X t > t 2 , X 3 - X 2 > t 3 }. (6.3) 

①这一命题多次为统汁估计的自的而被发现,但通常的证明是用计算方法而不是用马尔可 夫性. 参看 
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(在纯分析上，空间 R 3 被划分为由 X l < X 2 < X 3 所确定的区域的6个部分，每一 
部分上的积分值相同.两个或更多个坐标相等的那种边界事件有零概率，因而忽略 
不计 •） 为了估计 (6.3) 的右端，我们在以不等式 

*1 > tit X2 — Xl > t2, X3 — > <3 

确定的区域上积分 o 3 e _» h + q + M . 通过对 ar 3 的简单积分得到 

6 e~ ata [°° ae~ axi dxi f °° oe _ 2< Ma dr 2 
Jtl Jxi + t 2 

roo 

= 3 e - ot ，- 2ot,y oe ' 301 *^! = e -ots_2Qta-3atl . (6.4) 

于是 3 个变貴 X (1) , X m - X M , X w - X {2) 的联合分布是 3 个指数分布的乘积，命 
题得证. 

特别地，由此推出， E ( X (fc+1 广; f w ) = l /( n - fc ) a . 对*: = 0，1，...，1/-1 求和， 

得到 

e( 〜)) =$ + 占 + ••• + ( 6 . 5 ) 

注意，该期望的计算并没有用到的分布的知识，这里我们另有一个奸的例子， 
它通过表示一个随机变量为其他变童之和而导出命题.（参看第1卷 9.3 节 .） 

例 （ b ) 强马尔可夫性的 应用. 设3个人和 C 在时刻0到达邮局，发现两个 
柜台空闲着 • 3个服务时间是具有相同指数分布的独立随机变董 A 和 S 的 
服务是立即开始的，但是 （7 的服务是在4或 B 离去后在时刻 X ⑴ 开始.我们指 
出，马尔可夫性将得出各种问题的简单答案. 

( i ) C 不是最后一个离开邮局的概率是多少？答案是1/2,因为第一个离开时刻 
X ⑴在 C 7 和被服务的另一人之间建立了对称性. 

( u ) c 在邮局所用时间 r 的分布是什么？显然 ， r = x ⑴ + z 是二独立变量之 
和，这二变董的分布是具有参数 2 a 和 a 的指数分布.二指数分布的卷积由 (2.14) 
给出，可见 r 有密度 = 2 a ( e- ot - e - 2 ** 4 ), 并且 E ( T ) = 3/(2 a ). 

( iii ) 最后一个南开时刻的分布是什么？以 X (1) , X (2) , X (3 ) 表示依次离开的时刻. 
差 X W - X {1) 是变董 X ( 3 厂 X ( 2 ) 与 X (2) - X (1) 之和.在上例中已看到，这些变量 
是独立的，有参数为 2 a 和 a 的指数分布.因此， - X ⑴与变量 T 有相同的密 
度 u . 现在 X ⑴与 X ( 3 ) - X ⑴独立，有密度 2 oe ~ 2 at . 故由⑼中所用的卷积公式 
得有密度 

4 a [ e ' ttt - e - 2 at - ate - 2at ], 

而且 E ( X ( 3 )) = 2/ a . 



1.7 均勾分布 17 


与直接计算一比较，这一方法的优越性就很明显了，但是直接计算适用于任意 
的 服务时 间分布（习题 19). 

例 （ c ) 顺序统计量的 分布. 作为最后一个练习，我们导出的分布.事件 
{^( k ) < 0表示，在 n 个变量尤⑴中至少有 k 个 《 t . 这表示在 n 次独立试验中至 
少有 fc 次“成功”，因此 

P { X W = e - at )〜-(" -加 (6.6) 

微分后可见，的密度为 

n (= 二} ) G - e - Qt 产 -、-("-⑽⑽-气 (6.7) 

这个结果可由下面不严格的论证直接 得到. 我们要求（直至当 A -0 时依极限可忽 
略的诸项）如下联合事件的 概率：变董； ^中的一个位于 * 与 t + / i 之间，其余 n _ 1 
个变 S 中的 fc - 1个< t , 而其他 n - k 个变董 >t + h . 将选择次数与相应概率相乘 
便得到 (6.7). 建议初学者将这种论证写成明确的形式，并从离散的模型导出 (6.7). 
(在习题13和习题17中继续讨论 .） ► 

1.7 均匀分布 

随机变 贵 X 在区间^内是 均匀分 布的，如果对于 a < x < b ， 其密度是常 
数 = (b - a )- 1 , 而在此区间外邊 0. 此时变董 （X - a )( J » - a )- 1 在5^内是均匀分 
布的，通常我们利用0^作为标准 区间. 由于它的图像外形，所以也称均匀分布函 
数的密度为“ 矩形” 密度. 

对于均匀分&区间 JTi 变成一个样本空间，在其中，区间的概率和它的长度 
相等. 对应于在内均匀分布的 2 个独立变量 A •和 y 的样本空间，是 r 2 中的 
单位正方形，其概率定义为 面积. 同样的办法适用于3元和 r » 元的情形. 

均匀分布的随机变童常称为 “随机选取的点 X ” . “对中的点作 n 次独立 
随机选取”这一理想实验结果，要求用 n 维超正方体来作它的概率描述，而这样的 
实验在 同一区间中得 到《个点其中 没有任 何两点相等的概率为1,因 
此它们把 D 划分成 n + 1个子区间•把这 n 个点按其从左到右的自然顺序重新排 
列，得到 n 个新的随机变量，表示为 A ■⑴，…, X („). 这就是上节所定义的順 序统计 
量. 现在划分的子区间是其次是等等. 

在圆（周）上随 机地选 取点的概念是不需解释的.为了把圆上71次独立选取的 
结果具体化，我们设想圆是按逆时针定向的，因此区间有左端点和右端点，且可表 
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示为^的形式.两点和义2独立地选取，它将圆随机地分成两区间$7^和 
(我们不再考虑零概率事件=於). 

例 （ a ) 经验解释.轮盘赌的轮盘可作为在圆上实现“随机选取”的一般可以想到 
的工具.在6位小数的数值计算中，舍入误差通常作为在长度为 10~ a 的区间上的 
均匀分布随机变 M 来处理(对于因舍弃最后两位小数而产生的误差，具有100个可 
能值的离散模型是较合适的，虽然在实际中不大方 便). 盲目到达公共汽车坫的旅 
客的等待时间，可看作是在接连离开（汽车）之间的均匀分布 .1.8 节所讨论的随 
机分裂的应用具有较广泛的理论趣味.在许多数理统计学问题中（如非参数检验） 
均匀分布以间接方式被 应用， 给定任一具有连续分布 F 的随机变董 X ,随机变量 
F ( X ) 在？^中是均勻分 布的. （参看 1.12 节 •） 

例 （ b ) 随机 划分. 我们证明下面 命题： n 个独立且随机选取的点 X u ，.， X n & 
■划分成 n + 1 个区间，它们的长度有一个共同的 分布， 

P{L > t} = (1 - t) n , 0 < t < 1. (7.1) 

这一结果是惊人的，因为直观上，我们预料至少两个含端点的区间具有不同的分 
布. 但是，研究长度为1的（定向）圆的等价情形 ®, 所有 n + 1个区间都有同一 
分布就变成显然的了.这里 n + 1个点是独立地选取的，并且随机地 
把圆划分成 n + 1 个 区间； 由于对称性，这些区间应当有相同的分布，现在设想在 
点 X n + i 处把圆切开，则得到一个区间，其中 X u - -, X n 是独立且随机地选取的. 
n + 1 个随机划分的区间 长度是相 同的,它们有共同的分布.这一分布由 （7.1) 给 
出，只要研究最左端区间就可看出这一点.它的长度超过当且仅当 n 个 
点义1，…，在 O 中，而这 一# 件的概率是 (1 - t ) n . 

在用单位正方形表示的样本空间上考査3个事件，来验证在特殊情形 n = 2时 
的这一命题，是一个很好的练习（在习题22〜习题26中继续讨论). 

例 （ c ) 悻论 （与 1.4 节的等 待时间悖论有关). 在长度为1的圆上独立且随机地选 
取两点 Xi 和 X 2 , 则二区间和的长度是均匀分布的，但是包含一 
个任意点 P 的区间长度 A 有不同的分布（具有密度 2 i ). 

特别地，二区间中的每一个有期望长度1/2,但是含 P 点的区间有期望长度 
2/3. 尸点是任意固定的•我们认为，含 P 的区间的选取并“不增加关于其性质的知 
识”（借用概率论的哲学家的语 言). 虽然，朴素的直观不是为 解释* 盖或不覆盖一 
个任意点之间的显著差别而准备的，但是经适当的考虑之后，这差别变为“直观上 

①为了用计箅方法论证，注意亊件 { X (fc+1) - x w > t } 的*率等于常值函数1在 nl 个相应区域 
之并集上的 供分， 该区域或由一串不等式 XI < • • ■ < X * < z fc + 1 < z fc+ i <•••<*„ 聽定，或 
由交换下标而得的一串类似不等式聽定.更精细的计算导出更强的结果，包含在 3.3 节拥 （ c ) 中. 
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显然”了.然而在实际上，有些有经验的作者仍然在此被迷惑. 

为了证明，设想在 P 点把圆切开，且让我们在 07 T 上独立且随机地选取两点. 
用和前面相同的记号，事件 {A < t } 发生，当且仅当 X (2) - X (1) > 1 - t , 由 （7.1) 
式知这一事件的概率等于 t 2 . 因此，如所断言那样，变世 A 有密度 2 t . (建议初学者 
用直接计算来证明 .） 

例 （ d ) 順序统计量的分布. 如果不 ，… ，不》是独立的且在0^中均匀分布， 则满 
足不等式0 < t < 1的变 M 个数，具有“成功”的概率为 * 的二项分布.为使 
事件 {- x - ( fc ) < t } 发生，当且仅当诸 变董中 至少有 fc 个< t , 因此 

P {^( fc ) O 自(》(1 -(7.2) 

这给出了第 fc 个顺序统计量的分布函数.由微分可求出 的密度 

n (*-l) tfc ~ 1(1_t)n "*' (7 . 3) 

由此可见，诸&中，有一个在 * 和< + /»之间，余下的中，有 fc -1 个小于 f 而 n-fc 
个大于这一事件的概率等于 

除以办，并令 ft 一 0,便得 （7.3) 式. 

例 （ e ) 极限定理. 为了看出 rv 很大时 X ⑴ 的分布性态，最好把 E ( X ⑴）= ( n +1)- 1 
作为 新度董 单位.对于分布函数的尾部，当 n — oo 时，得到 

⑴ >0= (7.4) 

通常此式可表 述为： 义⑴依 极限是期望为 n - 1 的指數分布的 变量.类似地有 

- » e _t + te _t , (7.5) 

在上式右端看到 (3.5) 的 r 分布 G 2 的尾部_同样易证，对于每一固定的 fc , 当 
r » -» 00 时，的分布超于 r 分布 G * (参 看习题 33). 

原来， Gfc 是 fc 个独立指数分布的变量之和的分布，而 X ( k ) 则是例 （ b ) 所考 
虑的前 fc 个区间之和.因此，从极限意义上来说，我们划分的连续区间长度的性态， 
似乎与相互独立指数分布的变量一样. 
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[由二项分布 (7.2) 的明显关系式看到，当 n 和 fc 两者都大时，中心极限定理可 
用来得到 X ( k ) 的分布的逼近.参看习题 34.] 

例 （ f ) 比.令 X 是在 07 T 中随机选出的，以卩表示两区间 U 和571中较短者 
的长度，以 K = 1 - 1/表示较长者的长度.随机变贵 [/在 0和!之间是均匀分布 
的，因 为事件当且仅当 X <t 或 1- X<t 时才 发生，所以有概率 

2 t . 由对称性， V 在 | 和1之间也是均匀分布的，而且 E ( C 0 = i , E ( V ) = 关于 
比 V / U 我们可说些什么呢？为使 V / I / 超过1且在1和 t > 1之间，当且仅当 


对于 t > 1,由此立即得出 

P { K / t /<«} = ^ y , (7.6) 

它的密度是 2 (f + l )- 2 . 可见， V/V 有无穷期望. 此例说明，在对 E ( V )/ E ( U ) = 3 
的观测中，只能得到很少的信息. ► 


1.8 随机分裂 

本节的问题是总结上述例子的讨论，之所以把它从上节中分出来，部分原因是 
它在物理学中的重要性，部分原因是它可作为一般马尔可夫链的典型. 

在形式上，所讨论的是形如= XtX ^ - Xn 这样的乘积，其中 x u - -, x n 
是中均匀分布的相互独立随机变 M . 

有关应用的例子在某些碰撞过程中，一个物质质点被分裂成两部分，它的质最 
m 也一分 为二. 各种不同的分裂规律适合不同的过程，但经常假定，每一个后代质 
点所得到的那一部分母体质点的 质量在 0^中是均匀分布的.如果二质点之一被随 
机地选出并受到新的碰撞，则（假定没有交互作用，从而碰撞是独立的）两个第2 
代质点的质童为乘积 mXiXi , 等等.（参看习题 21.) 作简单的宇句改变，该模型也 
可用于矿物颗粒或小石子等的分裂上.代替质量，我们也可以考虑碰撞时的能童损 
失； 如果讨论的是同一质点在连续碰撞中的能贵变化，那么叙述可以稍微简单些. 
最后一个例子，考虑通过物质时光 的强度 变化. 1.10 节例 （ a ) 表明，当光线以“随 
机方向”通过半径为的球时，光在球中传播的距离在0到中是均匀分布的. 
在^吸收的情况下，这种通过导致入射光的强度按某一因子衰减，这一因子在区 
间 P 中均匀分布(其中 a < 1依赖于吸收强度)，尺度因子的单位并不会严重影响 
我们的模型，因此光的 n 次独立通过将导致光的强度具有形式的 因子. ► 
为了求出的分布，可采用两种方法. 
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( i ) 简化为指數 分布. 因为和的运算一般优于积的运算，我们取对数，令 U = 
- lnX fc , y fe 是相互独立的，对于 f > 0, 

= = (8.1) 

早在 (3.5) 式中已经算出 n 个独立指数分布的变 童之和 

5„ = n +" + K 

的分布函数 G „, 而且 Z „ = e - s " 的分布函数为1 — G „( lnt - ”，其中0 < t < 1.这 
个分布函数的密度是 t — 1 伽 ( lnt - 1 ) 或 

fn(t) = J ( ln 吾 )， 0 < * < L (8-2) 

我们的问题显然已经解决.这个方法显示出用适当变换进行推导的优越性，但 
是，成功取决于我们的问题与一个以前解决了的问题的偶然等价性. 

⑼递推方式对有关问题及其普遍化具有优越性.令 F „( t ) = P { Z „ 彡且 
0 < t < 1. 由定义， Fi («) = * .设 F n _! 为已知，并注意 Z „ = Z n .^ X n 是两个独立 
变撤的 乘积.给定= a :, 亊件 { Z „ < 0当且仅当 Z„-i ^ t / x 时才发生，且有概 
率 F n _ i ( t /®). 对所有可能的 a : 求和，则当0 < t < 1时有 

Fn { t ) = F n - i ( t / x)dx = J F n - i ( t / x)dx + t . (8.3) 

这个公式在原则上能使我们依次算出 F 2 , F 3 , 但实际上，最好用相应的密度/„ 
来进行 计算. 由假定， A 是存 在的. 依归纳法，假设 /„-: 存在，并注意当> 1 
时， / n - i ( s ) = 0,对 (8.3) 式求微分可得 

/”⑷ = 乂 ’ n_1 (备)今， (8.4) 

简单的计算表明，/„确实由 (8.2) 给出. 

1.9 卷积与覆盖定理 

本节的结果在其本身和某些明显的应用上都有相当的价值.而且预料不到它 
们会与某些表面上看来无联系的问题有关，如调和分析中的显著性检验 [3.3 节例 
( f ) l 、 泊松过程 [14.2 节 例⑷】 和随机飞行 [1.10 节例 （ e ) l . 因此，所有的公式及其变 
形都反复地被各种不同方法所导出就不奇怪了 •下面所用的方法由于简单和适用于 
有关问题，因而是著名的. 
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令 a > 0是固定的，以 Xu X 2 , - 表示在0^中均匀分布的相互独立随机变量. 
令 S„ = & + • • • + X„. 我们的第一个问题是求的分布及其密度 u„ = 

由定义， Xf 于0 < a: < a,U!(x) = a" 1 , 对于其 他的; r, «x(®) = 0( 矩形密度)•随 
后的可由卷积公式 (2.13) 定义，这里 (2.13) 记作 


易见 


«T»+i ⑻=~ / Vn(x- y)dy = - \U n (x) - U n (x - a)]. 


U2(I) 



xa~ 2 , 

(2a — x)a -s , 


0 ^ z ^ a, 
a ^ x ^ 2a. 


(9.1) 


(9.2) 


当然，对于其他的1,«2(1)=0. «2的图像是带有底边的等腰三角形，因此称 
U2 为 三角形 密度. 同样， U 3 集中在 w 上，它由3个不同的二次多项式来确定， 
这些多项式分别定义在区间的3个1/3全长的子区 间上. 为了得到一般的公式，我 
们引入下面的 

记号 实數 z 的正部，记为 


以下， 记号 x; 表示 (*+)", 即当I彡0时等于0,而当 x > 0时 等于； r n 的函数.注 
意，当 a: < fl 时， （a: - fl )+ 为0;当 a: > a 时， Or - a)+ 是一线性 函数. 利用这一记 
号，均匀分布可以写成下式， 


Ui{x) = (i+ - (*- a)+)a _1 . (9.4) 

定理1 令5„是《个在❿中均匀分布的 ft 立变量之和.令队⑻ = p { S „< a: }， 
以 《n = 以表其 密度，則对于 n = l ,2, ••和 I 彡0， 

灿)=丄自(-0-<, ㈣ 

知 +1( *) = &( _1 广 C : 0 (* -(9.6) 

(对于 a: < 0和 n = 0,这些公式亦成立，只要 定义; ^在负半轴上等于0,在正半 
轴上等于 1.) 

注意，对于在 （fc - l)a 和 fca 之间的点 z, 求和中仅有 fc 项不为 0. 在实际计算 
中，为了方便，不管总和的极限如何而直接令"从- oo 变到 +00. 这是可能的，因 
为根据规定， （9.5) 中的二项式系数在1/ < 0和// > n 时等于 0( 参看第1卷 2.8 节). 
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证当《 = 1时，断言 (9.5) 化为 (9.4), 这显然 成立. 现在我们用归纳法同时证明 
两个断言.设 (9.5) 对某一 n > 1成立.代入 (9.1) 得出， u „ + x 是两个和式的差.把 
第二个和式中的求和指标 */ 换为~ 1,得到 

、+制 =■ 丄1>1广 [(:) + (二) ] (―)" + ， 

它与 (9.6) 式相同.把 n 换为《 + 1,并积分这关系式就得到 (9.5), 证毕. ► 

(另一 证明包含在第1卷 11.7 节的习题20中，是利用离散模型取极限 .） 

令 a = 26,则变 M - 6在对称区间 U 中是均匀分布的，因此 n 个这样的 
变惫之和与有相同的分布_它由 + nft ) 给出.因此，我们的定理可以 
改写成如下等价的形式. 

定理 la n 个在二57中均匀分布的独立变量之和的密度是 

(2 i ,) n (!- 1 ), D - r (")(*+("- ^ wr 1 - P .7) 

我们转向一个有两种等价表述的定理，它在许多由应用所产生的特殊问题中 
是有用的.由于意外的幸运，所求的槪率可以简单地用密度 u „ 来表示.我们用一种 
有广泛应用的方法给出分析的证明.对于以几何论证为根据的证明，参看习题 23. 
定理2 在长度为 f 的圏上，有2条长为 a 的弧，它们的中点是独立随机选取 
的.这 n 条弧復美整个圓的概牟 ^⑷是 

< Pn ( t ) = a "( n - l ) lu „ ⑷ （9.8) 

它与下式相同 ： n 

Mt ) = 矣(_1广(:) (1 - if ): 1 • (9.9) 

在证明之前，为了以后的应用，我们先在形式上把定理改写一下.在 n 个中点 
中选一个作为原点，并将圆周切开平放在长度为 * 的区间取中.其余 n - 1个中 
点在取中随机地分布，显然定理2同样可表示成 

定理3令区间07?被独立随机选舡的 n -1 个分点：^,义 2 ,. 划分成 n 个 

子 区间. 这些子区间的长度没有一个超过 a 的概年 ip n ( t ) 等于 (9.9). 

注意，对固定的是 a 的函数，它表示从划分0^所得的 n 个区间中最 
大长度的分布* 数. 有关问题可参看习理22 〜 习题 27. 

证只要证明定理3即可.我们来证明递推公式 

< Pn ( t ) = ( n - l ) < p n - i ( t - x ) Y ' ( 9 . 10 ) 
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它的正确性可直 接由外 作为 （n - 1) 重积分的定义而推出，但是最好把 （9.10) 式 
作如下概率的叙述.在中最小者应当小于它有 n- 1种选择 •给 
定；^ = a;, 则X,在最左端的概率等于拟 - x )/ t ) n ~ 3 . 其余变董在中是均匀 
分布的，它们满足定理条件的条件概率是对所有的可能值求和，即得 
(9.10).® 

现在以 (9.8) 定义 u„ ，则 (9.10) 化为 

u„(t) = a -1 f Un - i ( t - x ) dx , (911) 

Jo 

这正是用来定义的递推公式 (9.1). 因此，只要对 n = 2证明定理 即可. 但是很 
明显，当0 < t < a 时， 灼⑷ =1;当 a < * < 2a 时，= (2o - t )/ t , 与 (9.8) — 
致. ► 

1.10 随机方向 


在平面 R 2 中选一随机方向，和在圆周上随机选一点相同 • 如果我们想以它与 
x 轴正半轴所夹的角来规定方向，则圆可表示为它的孤长0, 0 < < 2n. 对于空间 
R 3 中的随机方向，以单位球面作为样本空间，其上每一区域的概率等于它的面积 
除以 4 ji . 在 R 3 中选一随机方向等价于在该单位球上随机选取 一点. 因为它包括一 
对随 机变撤 (经度和纬度)，所以照理应将它放到第3章去讨论，但是它出现在这里 
似乎更为自然. 

命題 ( i ) ^ L 表示 R 3 中有随机方向的单位向量在固定直线（倒如; c 輛）上投影 
的长度，則 L 在瓦 T 中是均匀分布的，且 E ( L ) = |. 

命 H ( H ) 令卩是同一向量在一固定平面（倒如: ry 平面）上拢彩的长度，則对于 
0 < t < 1, t / 有密度 瓦 


E ( I /) = - n . 

重要的一点是两投影有不同的分布.第一个投影是均匀分布的，它不是由于随 
机性引起的，但是依赖于维数.在 R 2 中，⑴的对应命题包含在下列命理中. 

命题 ( iii ) 令 L 是 R 2 中单位随机向量在 a ; 輛上投影的长度，則 L 有密度 
并且 E ( L ) = 2/ n . 

® 对丁-密度的条件概率感到困难的读者,可把供设 Xj =x 换 为悝设 x-h<Xj<x, 后者有正撅率， 
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证 （ iii > 如果0是随机方向与 y 轴的夹角，则 L =| sine | •因此，对 OoecI ， 由 
对称性得到 

P{L < a :} = P {0 <0 < arcsinx } = ^ arcsina ;. (10.1) 

于是断言由微分而得出. 

命题⑴和命题 （ ii ) 称为关于两平行平面（这两平面到球心的距离要相等） 之 
间的球带面积与球带髙度成比例的基本定理.对于0 < t < 1,事件 {L < t } 以 
高为 2 t 的球带 | xi | < t 来表示，而 {1/ < t } 相应于高度为2 - 2 yT ^ 的球带 
|®3|5= V ^ F . 除常数因子外，它决定了两个分布函数，这两个常数可由两个分布 
函数在 * = 1处等于1的条件来确定. ► 

例 （ a ) 遢过球体 •令 i ； 是一个半径为 r 的球，是球上一点.过 AT 以随机方向 
作一直线交夕于点尸， 則线段 AT_P 的长度是一个在 0 和 2 r 之间均勾分布的随机 
变 

为看出这一点，考虑球轴 NS 和三角形 NPS , 该三角形在 P 处有直角，而且 
在 N 处有角 0. 因此， iVP 的长度是 2 rco 8©. 但 cos 0也是 JVP 上的单位向最在 
直径 iVS 上投影的长度，因此 cos 0在中是均匀分布的. 

在物理学中，这个模型被用来描述光线射过“随机分布的球体”. 把光线的吸 
收当作上节中随机分裂过程的一个例子（参看习题 28). 

例 （ b ) 显撤镜 下的圓 形 物体. 我们通过显微镜观察到的是细胞在平面上的 
投影，而不是它们的实际 形状. 在某些生物学实验中，细胞是透镜状的，可把它作 
为圆盘处理，只有圆盘的水平直径依它的本身长度来投影，而且整个圆盘投彩为一 
个椭圆，椭圆的短轴是最陡的半径的投影.一般地，假定圆盘方位是随机的，这表 
示它的法线方向是随机选取的.这时， 单位法线在 X 3 轴上的投影在0^中是均匀 
分布的.但是，这法线与; c 3 轴的夹角等于最陡的半径与町勿平面之间的角，因而 
短轴与长轴之比在 OHi 中是均匀分布的.有时，对实验的估计会以下面的错误意见 
为依据，即最陡的半径与 *1 X 2 平面之间的角是均匀分布的 • 

例 （ C ) 为什么两把小提琴的声响两倍于一把小提琴的声响？ （这个问题是重要的， 
因为响度与振动振幅的平方成比例 •） 到来的波可用随机单位向量来表示，两个小 
提琴的叠加效应相当于两个独立随 机向设 相加.由余弦定理，和向童长度的平方是 
2 + 2 cose . 这里0是两个随 机向董 之间的夹角，因此 cos 0在二 P ： 上是均匀分 
布的，且期望为 0. 因此，总长度的平方的期望确实是 2. 

在平面上 ， cos 0不是均匀分布的，但由于对称性，它的期望还是 0. 因此，这 
个结果对任何维数都 成立. 亦可参看 5.4 节例 （ e ). ► 

R 3 中的 随机向 量是指一个具有随机方向的向量，其长为是与其方向独 
立的随机变董.随机向董的概率性质完全由它在: T 轴上的投影所决定，利用后者常 
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可避免在三维空间中进行分析.为此，重要的是知道长度 L 的分布函数 V 与向童 
在: r 轴上的投影长度 L 的分布 P 之间的 关系. 现在込= XL , 其中 X 是单位向 
量在给定方向上的投影长度.因此， X 在上是均匀分布的，且与1独立.给定 
X = a ：, 事件 {& 彡 t } 发生，当且仅当1 O , 从而 ® 

F ( t )= f V { t / x ) Ax , t >0. (10.2) 

Jo 

相应的 密度， 可 通过撤 分得到 

/(t)= 乂 w ⑴ tK ， _ 

微分得出 

v ( t ) = t > 0. (10.4) 

于是，我们求出了 R 3 中随机向量长度的密度 《 与其在固定方向上的投影长度的密 
度/之间的分析 关系.关系式 (10.3) 被用在 t ; 巳知时求/， (10.4) 被用在/巳知 
时求 t ；. (这两个公式之间的不对称性，是由于方向与投影长度不独立这一事实引起 
的 •） 

例 （ d ) 速度的麦克斯韦 （ Maxwell ) 分布. 考虑空间中的 一随机 向*,该向董在 a : 
轴上的投影有期望为0、方差为1的正态 密度. 因为长度取正值，所以我们有 

/( t ) = 2 n ( f )= s/yii e - i * 2 , t > 0. (10.5) 

于是由 （10.4), 有 

v ( t ) = y /2/ iit 2 e -^ t \ t >0. (10.6) 

这就是统计力学中速度的麦克斯韦密度.通常的推导是把上述的论证和对/具有形 
式 (10.5) 的证明结合 起来. （另一推导参看 3.4 节 .） 

例 （ e ) 在 R 3 中瑞利 （Lord Rayleigh ) 的随机 飞行. 研究 n 个单位向量，其方向是 
独立且随机选 取的. 我们求其总向贵（或向量和） 的长度 L „ 的 分布. 不直接 研究该 
总向贵，而考虑它在 * 轴上的投影.该投影显然是 r » 个在二 IJ 中均匀分布的独立 
随机变量之和.和的密度由 (9.7) 当& = 1时给出.代入 (10.4), 立即看出 L „ 的密度 
为® 

Vn(I ) = 2"->~ 1)! ^ (_1)，， (")(* + n 一 2l/ )+' 2 . ® > 0. (10.7) 

①这一论证重复了 (8.3) 的证明. 

® 标准参考文献是钱癟拉泽克哈尔 （S. Chandrasekhar) 的论文1在 Wax(1954) 重印 )， 他计算了》> 3 , 
V4 . V6 以及的傅里叶 变换. 因为他用极坐标，所以 W„(X) 应当乘以 4JIX 3 . 才得出我们的 
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这个问题产生于物理学和化学中（例如，向量表示平面波或分子 链). 简化为一 
维则此著名问题变为平凡的了. 

同一方法适用于具有任意长度的随机向量，于是 (10.4) 能使我们把 R 3 中的随 
机游动问题化为 R 1 中较笱单的问超.当明显的解答难以得到时，中心极限定理提 
供了有价值的信息【参看 8.4 节例 （ b ) l . ► 

R 3 中的 随机向4 ■以类似的方式来定义.向量长度的分布 V 与投影长度的分布 F 显然 
由类似于 (10.2) 的公式联系起来，即 

F w=sr ,>v (s?) d8 - (_ 

但是，反演公式 (10.4) 没有简单的类似公式，为了用 F 表示 V ,需要依赖于相当高深的阿 
贝尔 ( Abel ) 积分方程理 论! 1 我们不加证明地指出，如果 F 有连续密度，则 

1- V ( x ) = *^ / /(^)^. (10.9) 

(参看习题29和习题 30.) 

例 （ f ) 二元轨道.在观察分光镜的二元执道时，天文学家只能测出向量在与视线垂直的 
平面上的投影.空间椭圆被投影为这个平面上的椭圆.原椭圆的长轴位于由视线及其投影 
所决定的平面上，因此可以合理地假定，长轴与其投影之间的夹角有均匀分布.（在原则上) 
由测*可确定投影的分布.于是长轴的分布由阿贝尔 （ Abel ) 积分方程的解 (10.9) 给出. ► 


1.11 勒贝格测度的应用 

如果在中的集4是有穷多个长度为 At , A 2 ，…的不重叠区间 A , • • •的 
并集，则均匀分布给出它的概率 


P{-<4} = Ai + Aj + • • •. 


( 11 . 1 ) 


T 列例子将表明，某些简单而重要的问题将导致无穷多个不相交区间的并集.定义 
(11.1) 仍是可用的，并把 P {>1} 和4的勒贝格测度等同 起来. 它和把概率与密度 
m = 1 的积分等同起来的程序相一致，除非我们用勒贝格积分，而不用黎曼积 


① 阿贝 尔积分方程的变换利用了变量替换 


= Vk(*) = v(-L) « xsin^e = 


于是 (10.8) 取形式 


1 Vvf.* - v) 
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分（该积分不一定存在).在勒贝格理论中只要求下列 事实： 如果 A 是可能相交的 
区间 - 的并集，则测度 P { M 存在，而且不超过长度之和 V + A 2 +….对 
于不相交区间，等式 （11.1) 成立.勒贝格测度的利用符合能想像得到的直观并且简 


化了问题，因此许多形式上取极限是正当的.集 iV 称为零集，如果它包含在有任意 
小的测度的集合中，即对于每一 存在一集 A ：) AT , 使 P { A } < e . 在这种情形 
T , P { N } = 0. 

以下 X 表示在 M 中均匀分布的随机变量. 


例 （ a ) x 为有理数的概率是多少？序列 mm …包含0^■中所有有理 
数（按分母的增大排列次序).选 e < $，以 J fc 表示中心在序列的第 jfe 个点上且有 
长度0+ 1 的区间. 所有 Jk 的长度之和是 e 2 十^ < e , 它们的并集*盖了有理 

数. 因此，由定义可知有理數集的橛牟为0,而 X 以概率1为无理数. 


试问，为什么在概率论中研究这种集？ 一个回答是：排除了它们就什么东西也 
不能得到，而且勒贝格理论的应用实际上不要求新的技术就把问题简化了.第二个 
回答对初学者和非数学家来说更是令人信 服的. 下述各种问题将具有确实的概率本 
质 • 


例 （ b ) 數字7以多大概牟出现在 X 的十进制小敷展开式中？在 0.7 和 0.8 之间 
的每 一 a ： 的十进制小数展开式中，数宇7出现在第一位.对每一 r », 有9"- 1 个长度 
为 10-" 的区间，其中在每个数的展开式中，7出现在第 n 位而不在前面出现.（对 
于 n = 2 ,它的两端点是 0.07 和 0.08, 其次是 0.17 和 0.18, 等等 .） 这些区间不相 

交，其总长度是去 G + 荟 +( 荟/十…)一 1 .因此，我们的事件的概年是 1. 

注意，某些数有两种展开式.例如， 0.7 = 0.6999 - , 因此，为使我们的问题明 
确起见，我们要明确规定，不管数字7在展开式中是否必须或是否可能出现，我们 
的讨论都与此 无关. 理由是只有有理数才有两种展开式，而且有理数集有零概率. 
例 （ c ) 掷硬币与随机 选取. 我们现在来看一看如何用离散随机变童来表述“在0 
和1之间随机选取一点 X ” •以 X k ( x ) 表示 I 的第 fc 位小败（为了明确起见，可能 
时我们采用有穷展开 式). 随机变童 X * 取值— 每个值有概率而且 X * 

是相互独 立的. 由小数展开式的定义，我们有恒等式 


X = D io- fc x fc . 


( 11 . 2 ) 


这个公式把点 X 的随机选取化为对它的小数的每一位依次选取. 

为了进一步的讨论，我们把十进制小数变换为二进制小数，即把基数10换为 



2. 代替 (11.2), 我们有 
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X = f ^2- k X k , 


(11.3) 


其中 X * 是相互独立的随机变量，它们都以概率 | 取值0或 1. 这些变董都是定义 
在区间? n 中，在区间上概率与勒贝格测度（长度）相等.这一表述使我们想起第1 
卷的掷硬币游戏，那里样本空间是由正面和反面即0和1的无穷序列组成.在此样 
本空间中， (11.3) 式可作新的解释.在其中， Xfc 是坐标变量，而 I 是由它们确定的 
随机变董；它的分布函数当然是均匀的.注意，第2种表述包含两个不同的样本点 
0111111和1000000,而相应的二进制展开式表示同一点^但是，零概率的概念使 
我们能把两个样本空间等同起来.用更直观的术语来说，忽略了零概率事件，在0 
和1之间随机选取一点 X 可以由 掷螋币 序列来 实现； 反之，无穷多次掷硬币游戏 
的结果可用5^中的点 a : 来表示.掷硬币游戏的每一随机变量可用? H 中的一个函 
数来表示， 等等. 这个方便和直观的方法在概率的理论开始起就被应用，但是它依 
赖于忽略零概率事件. 

例 （ d > 康托尔 ( Cantor ) 型 分布. 一种具有意想不到性质的分布，在下面的研究 
中被发现，在 (11.3) 中考虑偶数项的值或等价地考虑随机变量 

Y = 3^ (11.4) 


(乘以因子 3 是为了简化讨论，奇数项的值与有相同的分布).分布函数 f(*) = 
P { Y ^ x ] 将作为一个所谓奇异分布的例子. 

在计算中，我们把 K 作为赌徒的得利，如果第 fc 次掷均匀硬币出现反面规定 
赌徒得利 3 x 4-*. F 位于 0 和 3(4- J + 4- 2 +…）= 1 之间.如果第一次试验结 
果是反面，则得利> ^在相反情形， y < 3(4- 2 + 4- 3 + -.-) = i 于是不等式 
\< Y <\ 在任何情况下都不能成立，从而在这个长度为士的区间内， F ( x ) = 

由此推出 F 不能有大于 | 的跳跃 • 

其次，由添上因子 | 可看出，第 2, 3, …次 试验又构成了整个序列的复制品. 
因此， F 在区间0,^内的图形与在整个区间内的图形的差别仅在于一个相似变换 

F ( x ) = \ F { Ax ), 0<*<1 (11.5) 
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由此推出，在以 = r = ^为中心的长度为 | 的整个区间上， 

由对称性，在以 | 为中心的长度为 | 的整个区间上， 

作) =!• 

现在我们看到3个总长度为 i + | = j 的区间，在每一个区间上 F 取常数值， 
即 I - 或 I 因此， P 不能有大于 | 的跳跃.还剩下4个长度均为^的区间， 
在其中的每个区间内， F 的图形与整个图形的差别仅是一个相似变换.因此，这 
四个区间的每一个都包含一个有自己一半长度的子区间，尸在子区间上取常数值 
(即分别为 mi ). 用类似的方式继续下去，在第《步.我们将得到总长度为 
2 -i + 2 - a + 2_ 3 + ". + 2 - n = l -2- n & l +2 + 2 3 + ... + 2 n-1 个区间，在其中的 
每个区间上 F 取常数值. 

于是 F 是从 F (0) = 0桉如下方法增加到 F ( l ) = 1的连蛾*数，这方法要求取 
常数值的区间的长度相加直到等于 1. 粗略地说， F 的增加点全发生在测度为0的 
集上.这里，我们得到连续分布函数 F , 而没有密度 /. ® ► 

1.12 经验分布 

n 个, 01,02, -,0„在直线上的“经验 分布*數”八 是一个在叱，…， o „ 上 
具有跳跃^的阶梯函数.换句话说， nF n ( x ) 等于上的点 a fc 的个数， F „ 是 
一分布 函数. 给定《个随机变量它们在样本空间特殊点上的值构成一 
个 n 元数组，其经验分布函数称为经验样本 分布. 对于每 一 a :, 经验样本分布的值 
F „(*) 确定一个新的随机变惫，而且 { X !,- -, X n ) 的经验分布表示依赖于参数 a : 的 
一族随机变量.（用专门术语来说，所讨论的是一个以: r 为时间参数的随机过程 .） 
这里不企图展开经验分布的理论，但其概念可以说明，在简单应用中可以出现复杂 
的随机变董，而且均匀分布将以新的形式出现. 

令 X u …， X n 表示具有相同连续分布 F 的相互独立的随机变量.假设任意两 
变量取同一值的概率为0,因此我们可以把注意力限于由 n 个不同 fi 组成的样本. 
对固定的 or , 满 & X “ x 的变量為的个数是具有“成功”概率为 p = F ( x ) 的二 

~ ® 由此需特别注意，这里所说的连续分布函数与有密度的连读分布有本质区别,为此,后者有时称为连续 
型分布.一译者注 
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项分布，从而随 机变量 F„(aO 有可能取值为 0, l / rv,l 的二项分布.因此，对于大 
的 n 和固定的 x , F n ( x ) 可能近似于 F ( x ), 而中心极限定理吿诉我们更多关于可能 
偏差的情况.更有趣的是，作为整体看 F „( 随机变化）的图形以及它通近 F 的程度. 
这一逼近程度的度 M 是极 大偏差 ，即 

D n = sup | F n ( a :) - F (*)|. (12.1) 

„ —oo<*<oo 

这是一个统计学家们很感兴趣的新的随机变 M , 因为它有下列性质 i 随机变量 
的概芈分布与 F 无关 (当然，假设 F 是连续的). 

为了证明这一点，只需验证当 F 换为均匀分布时 A * 的分布保持不变.我们 
从证明变黃 u 在? n 中是均匀分布 入手.为此目的，我们将 * 限于区间 

5^内，在其中定义 v 为 F 的反 函数. 于是事件 { F { X k ) ^ t ) 与事件 {A < v ( t )> 
相同，它有概率 fw *)) = 由此断言， p{n <«}=*. 

变董的 ，…,匕是相互独立的，我们以 G „ 表示其经验分布.利用刚才的结果 
亦可证，对固定的 随机变最 G „ ⑴与风…⑴）等同.因为《 = F ( v ( t )) 逋含在样 
本空间 R n 中的每一点上有 


sup | G „ ⑷ - t \ = sup | F „( v ( t )) - F ( v ( t ))| = D „. 


命题得证. 

D n 的分布与原先的分布 F 无关的亊实，使统计学家能给出适用于原先分布 
未知时的试验设计和估计的方法.此时，与有关的一些其他变董有较大的实际 
应用. 

令 • • -, X n , X *, …， X # 是 2 n 个有相同连续分布 F 的相互独立随机变量， 
分别以&与表示 （ A ，…, X „) 和 ( Xf , …, XT ) 的经验分布.设 

= sup | F „( a :) - f 1 / ⑻ I . (12.2) 

这 是两个经验分布之间的极大 偏差. 与！>„有关的特性不依赖于分布 F . 因此，它 
适用于“假设 （ A ，…， X „) 和是来自同一母体的随机样本”的统计 
检验中. 

D n , n 的分布的计算和研究是一个麻烦的问题，但是格涅坚科 （ B . V . Gnedenko ) 
和科罗留克 （ V . S . Koroljuk ) 在1951年巳经证明，整个问题可以化为具有巳知解的 
随机游动问题.他们的论证因为优美而很令人喜欢，我们用它来说明简单组合方法 
的威九 

定理 P { D„, n < r / n } 等于对称随机游动中下列事件的 概牟： 它从原点出发并在 
原点结束，轨道长度为 2 n 且在结束前不到 达点土 r . 
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证只要考虑整数 r 即可.按照递增的顺序排列 2 n 个变董&， …, Xf , 并依照第 fc 
个位置出现' 或 X /而定 e fc = 1或 e fc = -1. 整个排列包含 ri 个1与个 -1, 并 
且所有(^)个顺序是等可 能的. 因此，所有 2n 元组与从原点开始又 
在原点结束的长为 2 n 的所有轨道成一一对应.现在如果+…+ q = fc ，那么前:/ 
个位置包含有 U + k )/2 个无#号变量和 ( j ~ k )/2 个有#号变量，因此存在一点 z , 
使得 P „( x ) = (?> A :)/2 n 和 #(*> = { j - k )/2 n . 但是，此时 | F „ ⑻-柯(3：)| = \ k \/ n , 
因此 D n , n > \ k \/ n . 反向的同一论证即可完成 证明. ► 

上述概率的 明農表达式包 含在第1卷 14.9 节 （9.1) 中，事实上， 

P { On,n < r / n } = Wr,n 

是质点从原点出发在时刻 2 n 返回原点而从不 到达土 r 的概率.后一条件可 由在士 f 处设一 
吸收壁而实现，从而 是士 r 为吸收壁时在时刻 2 n 返回原点的概率.[在第1卷 14.9 节 
(9.1) 中，区间是而不是 - r , r . 我们的 w r .™ 与 Up . an ( r ) 相同 • j 

在第1卷第14章中巳经证明，极限手续可由随机游动导致扩散过程，依此方法不难 
肴出 VHD n , n 的分布趋于极限.实际上，这•极限早在1939年就被斯米尔诺夫 （ N . V . 
Smirnov ) 发现，而 y / HD n 的类似极限在1933年为科尔莫戈罗夫 （ A . Kolmogorov ) 发现. 
他们的计算是很复杂的，而且不能说明与扩散过程的联系，这在格涅坚科-科罗留克方 
法中是特 有的. 另一方面，他们在随机过程收敛性上给出了有成效的工作（如比林斯利 （ P . 
BiUingsley ). 唐斯克尔 （ M . F . Donsker ), 普罗«洛夫 （ Yu . V . Prohorov ), 斯科罗 ffi 德 （ A . 
V . Skorokhod ), 等等). 

可以指出，斯米尔诺夫定理同样适用于有不同样本大小 m 和 n 的经验分布的误差 
D m , n . 随机游动的方法可以用上去，但却不够优美和简明（格涅坚科 （ B . V . Gnedeko )、 勒 
瓦切瓦 （ E . L . Rvateva )). 许多不同形式的 D m , n 巳被统计学家们研究（参看习题 36). 

1.13 习 题 

在所有的习题中，假定给定的变量都是相互独立的. 

1.令 X 和 y 集中在0^5上的密度为 ae -~. 求下列各变量的密度， 

⑴沪， ⑼ 3 + 2 X , 

( m ) X - Y , ( iv ) \ X - Y \, 

( v ) 久和 Y 3 中较小者， （ vi ) 久和 V 3 中较大者. 

2- 求解如上问题，但设 X 和 y 的密度在上等于在外等于 0. 

3. 如果 A " 的密度为 ae- a *(x > 0且《 > 0)， Y 的密度当0 < * < fc 时等于 / T 1 ， 求 
x + y 与 x — y 的密度. 

4. 求 A 2 -2 aA + 6 有复数根的概率，如果系数 a 和6是随机变量，其共同密 度为： 

( i ) 均匀的，即当0 < * < fc 时为 h _\ 
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⑼指数的，即当 *>0 且 c »>0 时为 ae -«. 

5. 如果变量 _ x ■，: K 和 Z 有相同的指数分布，求 X + y / x 和叉+ y / z 的分布函数. 

6. 通过对第1卷6_8节 (8.1) “负二项分布 • 卷积公式直接取极限来推导指数分布的卷积 
公式 (3.6). 

7. 在 1.4 节的泊松过程中，以 Z 表示时刻 t 与 t 前最后一次■■到 达- 时刻或时刻0之间 
的时间（即 t 前最后一个间隔时间).求 Z 的分布，并证明当 t — oo 时其趋于指数分 
布. 

8. 在 1.5 节例 （ a ) 中证明了，出现在第 n 个位置上的第一次记录值< a : 的概率等于 

试确定第•次记录值的概率分布是 1-(1 + or ) e - a *. 

[ M —般地，如果 X ,是正的，服从任一连续分布则上面所求的概率等于 [ n ( n + 
1)]- , F " +, (*) 1 第一次记录值的分布是 F - (1 - F ) ln ( l - F )- 1 .] 

9. 下降路程.定义随机 变量尺 为使不等式 Xi ^ X 2 > > Xn-i < X N 成立的唯一下 
标.如果 X ,有相同连续分布试证 P[N = n > = ( n - l )/ n !, 并且 E ( AT )= e . 

提示 I 利用关于记录值的 1.5 节例⑷的方法. 

10. 运输中车队的形成 .® 汽车接连地 从原点 出发，各以不同的但恒定的速度沿着无穷长 
的公路行驶，在这公路上不能 超车. 当一辆汽车赶上另一辆较慢汽车时，就被迫以较 
慢的速度跟随前进.因此，便形成一个汽车队，车队最后的车数依赖于车速而不依赖 
于相继出发的时间. 

把汽车速度看作具有相同连续分布的独立随机变量.随机地选出一辆汽车，并且设下 
一辆汽车正要出发.用 1.5 节例 （ a ) 的组合方法证明， 

( a ) 给定的一辆汽车不跟随任何一辆汽车的概率趋于1 

( b ) 由这辆汽车产生车队的车败为 n (确实有 n - 1辆汽车 R 随在它后面）的概率趋于 
l/(n + l)(n + 2). 

( c ) 给定的这辆汽车是车数为 n 的车队中最后一辆的概率趋于同一极限. 

11- 记录值 1.5 节倒⑷ 的推广 ®. 代替对单个数值 X 0 的预先观察，我们从 具有顺 序统计 
凿( X ⑴,… ㈣ ）的样本 开始. （共同分布 F 不起作用，只要它是连续 
的即可 .） 

( a ) 如果汉是使 X m+n > X lm ) 的第一个指标 n , 证明 P{AT > n > = m/(m + n ) •[在 
1.5 节例 （ a ) 中 ， m = 1.1 

( b ) 如果 iV 是使 X m+n ^ 的第一个指标 n , 证明 

一 -㈡ /('+"). 

① G. F. Newell, Operationa Research, Vol. 7(1959). pp. 589—598. 

® S. S. Wilks, J. Australian Math. Soc., Vol. 1(1959), pp. 106—112. 
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对于 r > 2 , E ( JV ) < 00 ,且 

P{N 4： mx ) - > 1 - ^^ x y , m -» oo . 

( c ) 如果 W 是使 X m + n 落在区间 X w X lm ) 外部的第一个指标，则 

呵 且 E ( w )<~. 

12. (栺敷分事的卷 积). 对于， • = 0，.", n . 令 Xj 的密度为> 0), 其中 Aj 鈐 A “除 
j = fc 外)•令 

^ k,n = [(Ao — A *) - • • ( A*_i — Afc )( Afc 4 -i - A *) • • • ( A » — A *)] -1 , 

证明 Xo + • • • + X „ 的密度由下式给出 I 

/*n ⑷= Ao … An-1 [Vto.ne - * 0 * + ••• + (*) 

提示 i 利用归纳法、对称论证和 (2.14). 不需要计算. 

13. (读上).如果 K 具有密度 je ~ ix , 则和式 Yi +--- + Y n 的密度为 

= *> 0 . 

如果；0有相同密度试利用 1.6 节例⑻的命埋，断定 /„-! 是样本 X lt - -,Xn 
的极差的密度. 

14. 纯生过 《. 在第1卷 17.3 节的纯生过程中，体系通过一列状态岛)—玖4…，在恥 
上的逗留时间为它具有密度 A „ e - A *". 千是 S n = X 0 + ..■ + X n 是 E n — E n+1 
的转移时刻.以⑴表示在时刻 t 体系处于 状态瓜 的概率.证明 

P „( t ) = - P {5„ > t }~ P { S n -l > t >, 

因而氏 由习题 12 的公式 （*) 给出.此过程的微分方程，即为 

托⑷= - Aoft ( t ), K ( t ) = - A „ F „( t ) + Xn - lPn - l ( t ), n > l . 

由⑴式导出⑷，由和式 S „ 的性质导出 （ b ). 

提示《归纳地利用对称论证，只要考虑 e _〜 的因子就行了 • 

15. 在关于并行等待线的 1.6 节例 （ a ) 中，说体系处于状态 fc , 如果有 A ： 台计算器空闲着. 
证明上例的纯生过程棋型对于 A fc = ( n - fc ) a 也适用.求证 

ft ⑷=(:) (1 - e at ) fc e - (n - fc)ot . 

由此导出 X w 的 分布. 
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16. 分别考虑由 m 和 n > m 人排成的两个队伍，假定賑务时间有相同的指数分布.证明 ■ 
较长的队伍首先脤务完毕的概率，等于扔均匀硬币游戏中在出现 m 次反面以前出现 
n 次正面的概率.考虑两个变量（它们分别有由 (3.5) 给出的 r 分布 G m 和 G „) 之比 
X / Y , 并求出相同的概率. 

17. 故计估计的倒子.假定电灯泡的寿命为指数分布，但是期望未知.为估计 a , 取有 
n 个电灯泡组成的一个样本，并观察前 r 个电灯泡的使用寿命 


X ( i ) < X (2) < ••• < - X ( r ). 

cT 1 的“最佳无偏估计量”是这样一个线性组全 C / = XiX w + ••• + A r X ( r ), 使得 
E ( l /) = a - 1 , 且 Var (£7) 尽可能为最小.试证明 

U + ••■ + + X ( r )(»» - *•);， 

且 Wax(U) = ia -a . 

提示： 借助于独立变量进行计算（参看 1.6 节例 （ b )). 

18. 如果变量 X u …， X n 在町 中是均勻分布的，证明，极差 X ln) - X W 具有密度 
n ( n - l ) a:"- a (l - *), 且期望为 （n - l)/(n + 1). 所有 n 个点在长度为 t 的区间内 
的概率等于多少？ 

19. 当3个服务时间在町中均匀分布时，解决 1.6 节例 （ b ) 的习埋.（注 I 习埋包括冗长 
的计算，但是这可提供运算技巧方面的有用练习 •） 

20. 在圆上独立且随机地选取4个点.求弦 XiX 3 和弦 X 3 X A 相交的概率> ( a ) 不用计算 
而用对称论证 i ( b ) 由积分定义. 

21. 在 1.8 节随机分裂过程中，以 X u 、X 13 ,X 2U X n 表示第二代4块碎片的质量，下标1 
指较小的碎片，下标2指较大的碎片.求这些变量的密度和期望. 

注下列几个习题包含一些关于区间的随机划分的新定理渗看 1.7 节例⑻】.设变量 
Xi, - X n 是独立的且在巧中是均匀分布的.它们把这区间划分成 n + 1 个于区间， 
子区间的长度按照原有顺序以 L u -.-,L n+ i 来表示[用顒序统计量的记号，我们有 

Li = X ⑴， La = X( a )-X ⑴， … ， Ln+i =t- X(„).] 

22. 以 Pn(t) 表示所有 n +1 个区间长度都大于 A 的概率.[换句话说， Mt) = p { minL fc > 
h}, 它是诸区间中最短者的分布函数的尾部.丨证明递推关系式 

Pn(t) = 告 J 。 a ： n_1 pn-i(aOdx, (*) 

并求出 M 0 = *""(«-(«+ i ) W - 

23. 类似于 （*) 式，不用计算，证明 | 对于任意 

P{Li > Xl,---,Ln+l > In+l} = t~ n (t — *1 - Zn+l)+- (**) 
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[这一优美的结果是德 • 菲内蒂 （ B . de Finetti ®) 由几何学的研究而推 出的. 它包含许 
多有趣的特殊情形.对一切 j , 当 A = /» 时， 我们得到上题 1.7 节例 （ b ) 相当于 而中 
确实有一个不为0的特殊情形.对于1个亊件中至少有一事件出现的情形， 1.9 节 
的覆盖定理3可由 （**) 和第1卷 4.1 节 (1.5) 式推出 .1 
24•以 q n ( t ) 表示所有的相互距离都大于/»的概率（它与习埋22的不同之处在于，对 
两个端区间 M 和 i „ +1 不加限制 .） 求类似于 （*) 的关系式，从而推导 qn ( t ). 

25. (续上) •不用 上题的方法，证明办⑷= r n (t - 2/ i ) n 如 (* - 2 A ). 

26. 对圆来叙述类似于习题 24 的问題，并证明，习题23提供了它的解答. 

27. 一等限三角形， 由* 方向上的单位向量和任意方向上的一向量所组成. 

( i ) 在 R 2 中， （ a ) 在 R 3 中求第三边长度的分布. 

2 8•以0 为中心 的单位圆(球）在正: r 轴上有 北极. 一射线通过北极，且它与 a ; 轴的夹角 
在上是均匀分 布的. 求圆（球）内部弦长的分布. 

注在 R 2 中，射线有任意的方向，所讨论的习题与 1.10 节例⑷ 类似.在 R 3 中习题 
是新的. 

29. 一随机向置与它在: r 轴上投影的期望长度之比，在 R 3 中等于2,在 R 2 中等于 ji /2. 
提示 | 利用 （10.2) 和 (10.8). 

30. 一随机向置的长度在 07 T 上是均匀分布的.在 （ i ) R 3 中和⑼ R a 中，求 向童在 * 轴上 
投彩长度的 密度. 提示，利用 （10.4) 和 (10.9). 

31. 求 R 4 中一随机选取的方向在 z 轴上投影的分布函数. 

32. 在1^中，求一随机向量长度分布与它在: r 轴上投影长度分布之间的关系.它类似于 
(10.2) 式. 特别用单位向量验证习題 ai - 

aa . 順 序統计 董的极限定殖 •（ a ) 令 X u -" X n 是在0：!中均匀分 布的. 证明，对于固定的 
fc 当 —* 00时 

P ^ ~ * Gk-i(x),x > 0, 

其中 G * 是 r 分布 (3.5) [参看 1.7 节例⑻]. 

( b ) 如果 X * 有任一连续分布函数则对于$ ^(|)}.同一极限存在，其 
中#是 F 的反函数.（斯米尔诺夫 .） 

34. 样本中位数的极限定理•（不，… , X an . i ) 的第 n 个顺序统计置 X („) 称为样本中位败. 
如果独立且在 u 中均匀分布，证明 

其中饥表示标准正态分布. 

① Giornale Istituto Italian。degli Attuari, vol. 27 (1964), pp. 151—173, 意大利文. 


35. 味上•令 X ， 有连续密度为/的共同分布 F •令 m 是理论中位数，即 F { m ) = 证明 

P { X W < x ) = (2n-l) 匕二 广 -1 (!/)[1 - F(»)r -1 /(lOdy. 

利用上題，由此得 

十⑷ - m < 7^ 卜琳 

36. 证明 1.12 节格涅坚科-科罗留克定理的下列变形 ： 

七剛-咖 》;}- ㈡ / ㈡ ’ 

其中 r = l, 2, •••,》»( 与原来的表述相对照，左边绝对值被省略了，从而在有关的随机 
游动中，只有 r 处为一吸收壁 .） 

37. 由均匀分布变量到指数分布变童的生成•①令义^石，…独立且在 in 中是均匀分布 
的.随机变董况定义为使 X N - x < X N 的下标（参看习题 9). 证明 

p{x t <*,Ar = „} = ^£- 15f _£ r) 

由此得出 P{X, ^ x , N 是偶败 } = 1 - e_*. 

定义 y 如下，4 “试验•是满足以上条件的一列变量 x u .. , x Ni 如果 JV 是奇数， 
则试验“ 失败' 我们反复独立地做试验直到取得“成功' 令^等于失败次数加上成 
功试验中的第一个变*.证明 | P{K<i> = l-e-. 
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本聿的主要目的，是叙述后面各章中经常出现的密度以供参考引用.第2部分 
叙述的随机化方法有着广泛的应用.其范围可用推导某些与贝塞尔 ( Bessel ) 函数有 
关的分布来说明，这些贝塞尔函数出现在各种应用中.它表明这个简单的概率方法 
可代替复杂的计算和困难的分析. 


2.1 符号与约定 

我们认为，密度/及其分布 F 集中 ® 在区间 J = 0上，如果对于 J 外的一切 
x ,/( a ：) = 0. 于是， 当; c < a 时， F ( x ) = 0；当 z > &时， F ( x ) = 1. 两个分布尸和 
G 或其密度/和 g 称为 是同类型的， 如果它们满足关系式 


G ( x ) = F(ax + 6), g ( x ) = af(ax + b ), (1.1) 


其中 a > 0. 我们常把&称为中心 ( centering ) 参数， a 称为尺度 ( scale ) 参数.这些术 
语通过如下事实是容易理解的> 当 F 作为随机变谩 A " 的分布函数时，则 G 是 


Y 



( 1 . 2 ) 


的分布函数.在许多场合，只有分布的类型才真正显得重要. 
/( 或 F ) 的期望 m 与方差 tr 2 定义为 


xf ( x ) dx , a 3 = /" (x — m ) 2 f ( x)dx = f x 2 f ( x)dx — m 2 , (1.3) 

J —OO J—DO 


如果这些积分绝对收敛的话.此时由 （1.2) 式显然可见， 3 有期望 ( m -6)/ o 与方差 
< r 2 / a 2 - 由此推知，对于每一类型的分布，至多存在一个期望为 0 且方差为 1 的密 
度. 

回想 1.2 节 （2.12) 式，两个密度方和/ 2 的卷积 J = h * h 是一概率密度，定 
义为 OO 

/(*) = J fi(x- v)/2(v)dy- (i-4) 

® 按照通常的用法，区间 I 的闭包称为/的支集 (support). 引进新术语是为了在更一般的意义上利 
用它，例如，分布可以集中在整数集或有理数集上. 



当 A 和/ 2 集中在 W 上时，这个公式化为 
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/(*) = J o /i(* - 1/)/2 (»)dy, a:>0. (1.5) 

上式表示两个具有密度 A 和/ 2 的独立随机变童之和的分布密度.注意，对于 
= fi(x + bi), 卷积 g = gi * g；2 由 g(x) = f(x + 61 + 62 ) 给出，这由 ( 1 . 2 ) 
式显然得知. 

最后，我们想起标准正态分布函数及其密度，它们由下式定义： 

饥⑻ = 去£ /為， •) = 士 -K ⑽ 

我们早就知道，具有期望 m 与方差 ff 2 的正态密度由下式给出I 

在中心极限定理中隐含着一个基本事实：正态密度族关于卷积是封闭的；换句话说， 
两个具有期望 mj,m 2 与方差的正态密度的卷积是一个具有期望 + ma 与 
方差 cr 2 = af + ai 的正态 密度. 鉴于上述亊实，只须对于 m 1 =m a = 0 来证明它即 
可.它断言 

_ 嘉] = 2^/ l exp [-与产 _ 為 W ( L7 ) 

利用变贵替换2 = vicr/axcr^-x^/acTx), 这个断言的正确性就显然了，其中 a: 是 
固定的 .( 见习题 1.) 

2.2 r 分布 

伽玛兩数 r 定义为 

T(t) = 厂 x*- l e~ x &c, t > 0. (2.1) 

1 见第 1 卷 2.12 节 (12.22).] 它依下式引入 阶乘： 

r(n + 1) = n!, n = 0,1,---. 


由分部积分可证 r ( f ) = ( t - i ) r(t - 1 ) 对一切 t > o 成立（习题 2 ). 
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集中在0755上的 r 密度定义为 

fa , v ( X ) = J ^ ya u ; c w _1 e _a ' V > 0 ，X > 0. (2.2) 

这里 a > 0是平常的尺度参数，而 w > 0是本质的 参数. 特别 /< M 表示指數密 
度， 1.3 节 (3.4) 中密度知与 / a.„(n = 1，2，".)重合.简单的计算表明，/<»,„的期望 
等于 w / a , 方差等于 v / a 2 . 

r 密度族关于卷枳是封 闭的： 

fa.ii * fa,v = fa , ii+vt M > 0， t > > 0. (2.3) 

这个重要性质推广了 1.3 节的定理并经常被 应用； 其证明很简单.由 （1.5) 式， (2.3) 
式的左端等于 

（2 . 4) 

经代换 y =时之后，此表达式和 fa ^+ vix ) 不同之处仅在于一个数值系数；因为 
/ a ， M + t ■和 (2-4) 式两者都是概率密度，所以这个系数等于 1. 

在 a : = 1时，可以通过 (2.4) 式得到所谓0积分 S ( A *， V ). 作为这个证明的副产 
品，我们有 

B ( n , v ) = (1 - M >0, v >0. (2.5) 

[当 /! 和 V 为整数时，此公式已在第1卷 6.10 节 （10.8) 和 (10.9) 中应 用过. 也可见 
本章习题 3.] 

关于的困像，当《 < 1时显然是单调的，且当 v < 1时在原点近旁是 
无界的.对于 v > 的图像是钟形的，在 a : = v - 1处达到它的最大值 （w - 

1 广此值接近于 [2 „(„ - 1)]4(斯特林 ( Stirling ) 公式，第 1 卷 2.12 
节的习题 12), 由中心极限定理得出 

- " W . v -* oo . (2.6) 

*2.3 与统计学有关的分布 

r 密度在数理统计学中起着决定性的作用，虽然有时不甚明显.首先，在皮尔 
逊 （ K . Pear 8 on )(1894) 引进的古典（现在有点过时）密度系列中， r 密度作为 III 
型 出现. 它的经常出现是由于具有正态密度 it 的随机变贵尤，变量 X 2 的密度是 
x ~ in ( x ^) = 由卷积的性质 （2.3) 得出： 

* 本节讨论的特别问*,以后并没有用到. 
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如果义^^^义是相互独立的正态随机变量，期望为0,方差为 cr 2 , 則 _Xf + ...+ 
巧具有密度 

对统计学鉍来说， X 2 = X ? +…+々是“正态总体的样本方差”，它的分布常 
被应用.由于传统的理由（从皮尔逊开始)，/|, 4 „称为具有自由度 n 的 x 2 密度. 

在统计力学中， X ? + + X | 表示质点速度的 平方. 因此， 1/(*) = 2 x/ iif ( x 2 ) 
表示速度本身的密度.这就是麦克斯韦密度，它在 1.10 节 （10.6) 式中用其他^法求 
出（也可参见 3.4 节中的例). 

在排队论中， r 分布常称为埃尔朗 ( Erlang ) 分布. 

对统计学家有重要意义的一些随机变童（或“统计量”）具有形式 T = X / Y , 
其中 X 和 K 是独立随机变量 ， y > 0.用 F 和 G 分别表示它们的分布， f 和 g 表 
示它们的密度.当假定 V 取正值时，3集中在0^5上，因此， 

P{r ^ t } = P{X < tY } = £ F ( ty ) g ( y ) dy . (3.1) 

由微分可得出 r = x/y 的密度 



f ( ty ) yg ( y ) dy . 


例 （ a ) 如果 X 和 y 具有密度 / ijm 和/ 4 , 4 „，则 X / Y 具有密度 


(|(m + n)) “m-l 

ilrn)T(\n)^)^' t>0 - 


事实上 ， （3.2) 式的积分值等于 


(3.2) 


(3.3) 


ti m ~ l 

2 l<-+-)r(im)r(i„) 



作代换 -(1 + *)!/ = «，可得 (3-3). 

在方差分析中，我们研究一种特殊情形： 


(3.4) 


尤 = Af+ ■.. + # 和 r = if + ... + y ; 2 ， 

其中 x 1) ---, x m , y 1 ,.-., y n 是具有相同的正态密度 tt 的相互独立随机 变量. 随机 
变童 F = ( nX / mY ) 称为斯内德克 ( Snedecor ) 统计量，它的密度 （ mAOuKm / jOa : 称 
为斯内德克密度或 _ F 密度.变量 Z = ln ^ F 是费希尔 （ Fisher ) 的 Z 统计董，它的 
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密度称为费希尔 ( Fisher ) 的 Z 密度.当然，这两种统计董只是在记号上有些变化而 


巳 ■ 

例 （ b ) 


学生氏 T 密度•令 X , Yt ,■ 独立且具有相同正态密度 it , 变量 

^ + ... + Y ^ 


(3.5) 


是统计学家通常所说的学生氏 r 统计 M . 我们知道它的密度为 

’ = (l + tV^)i(n + l)- 其中 = ▲ %:)))• (3 ' 6) 

事实上， (3.5) 式中的分子有期望为0方差为 n 的正态密度，而分母的密度为 
2 x / liin (: E 2 ). 于是（ 3 . 2 )式化为形式 

(3 - ?) 

作变换« = ^(1 + m 上述积分化为 r 积分，即得到 （3.6) 式. ► 

2.4 —些常用的密度 


下面我们不再说明，所有的密度在所述的区间外恒等于 0. 

⑷双侧指数密度定义为 iae - l - l , 其中 a 是尺度参数.它具有期望0与方 
差 2 a ~ 2 . 它是指数密度> 0) 与其嬈象密度 ae M (:c < 0) 的 卷积. 换句话 
说，双側指数密度是 X 1 - X 2 的密度，这里与 X 2 独立且有相同的指数密度 
ae-°*(x > 0). 在法国文献中，它通常称为“拉普拉斯 ( Laplace ) 第二律”，第一律 
是正态分布. 

( b ) 集中在=5^中的均匀（或矩形)密度 p „ 和三角形密度 r a 分别定义为 

Pa ( x ) = 7-«(*) = ^( l -^), kl < a . (4.1) 

容易看出， p a *Pa = T 2 a . 用文宇表示：两个在=5^中均匀分布的变董之和在 
-2^2 a 中有三角形分布.【多重卷积办 * … * p a 巳在 1.9 节 （9.7) 中叙述 •] 

( c ) 在03中的密度定义为 


爲* ,«(*) 


T{n + v) 

r(M)r ⑻ 


(I-*)**- 1 * 0 - 1 ， 


0 < a : < 1, 


(4.2) 


其中只>0和 t ;>0 是自由参数•由 (2.5) 式可知， （4.2) 式确实定义了一个概率密 
度由 （2.5) 式可见，馬,„有期望 v/(ji + v ) 与方差/«;/[0* + w) a (Ai + v + 1)]. 如果 
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/i < l，v < 1, 则九 ,„ 的图是 C / 形的，其极限趋于 oo. 对于 H>1,V>1, 图是钟形 
的.对于 /X = v = 1的特殊情形，则得到均匀密度. 

0 密度的一个简单变形定义为 

= (i{V 一 ， 0<t<o °. (4 - 3) 

如果变 M X 的密度为 （4.2), 则 Y = X~ i -l 的密度为 (4.3). 

在皮尔逊系列中，密度 (4.2) 和 (4.3) 作为 I 型和 VI 型出现.斯内徳克 ( Snedecor ) 
密度 （3.3) 是 (4.3) 的特殊 情形. 密度 (4.3) 常以经济学家帕雷托 ( Paxetb ) 来命名■可 
以认为（从现代统计学观点来看是比较自然的)，收入分布的尾部当 x - oo 时其密 
度近似于 Ai -«,(4.3) 满足这一要求. 

( d ) 著名的反正弦密度 


ny/x(l -x) 


0 < * < 1. 


(4.4) 


实际上和/3密度相同，但是因为它在起伏理论中经常出现，所以应该特别陈 
述（它在第1卷 3.4 节中引入，因为它与逗留时间的意外性质有关).遗憾的是，被 
人误解的名称在广泛流传，实际上分布函数为 ZjiMarcsinViJ 具有/! + « = 1的冷 
密度经常是指•■广义反正弦密度” .） 

(e) 以原点为中心 的材甴 (Cauchy) 密度定义为 

• 7 t ( x ) = ~ t a ^a. 2 ' -oo < x < oo, (4.5) 

其中 t > 0 是尺度参数.相应的分布函数是 

^ + 3i _1 arctan(i/t). 

%的图形与正态密度的图形相似，但是它接近坐标轴很缓慢，以致于期 a 不存在. 
柯西密度的重要性是由于卷积公式 


7» * 7 t = 7.+ t - (4.6) 

它说明材西密度族 (4.5) 对卷枳运算封公式 (4.6) 可以用初等（但是乏味）的方法 
把被积函数分解为部分分式来证明.比较简单的证明可用傅里叶分析. 

卷积公式 (4.6) 有一个惊奇的结论1对于具有相同密度 (4.5) 的独立变量 X u --, 
X n , 它们的平均 （ X 1 + ". + X„)/n 与&有相同的 密度. 

例考虑一个实验室的试验，用垂直反射镜把水平光线投射到墙壁上.此镜围绕经 
HA 的垂直轴自由旋转.假定反射光线的方向是“随机地”选取，即它与墙壁的垂 
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线1的夹角在和之间是均匀分布的.光线与墙壁相交于一点，它到 
原点 O 的距离为 

X = t - tanv ? 

(其中 < 是墙壁到中心4的距离 AO ). 显然，随机变憊 X 具有密度 （4.5).® 如果试 
验重复了 n 次，则平均值％ + • •• + ；?„)/« 有相同的密度，像大数定律那样，我 
们可以推知，平均值不集中在0的周围. ► 

柯西密度有一个奇妙的性质，如果 X 的密度为％,则 2 X 的密度为 72* = 

因此， 2 X = 义 + X 是两个相关变量之和，但是它的密度却由卷私公式给出.更一般 
地，如果和 V 是两个具有共同密度 7 t 的独立变董，且 X = aU + bV,Y = cU + dV , 
则 X + y 的密度为 7( a +6+ c +< i ) t , 它是又 的密度 7^+ Wt 与 y 的密度 7( c + d ) t 的卷 
积； 然而， X 和 y 并不独立.（有关的例子可见 3.9 节中的习题 1.) 

[ 柯西密度相当于学生氏: T 密度族 (3.5) 当 n = 1时的特殊情形.换句话说，如 
果 A •和 y 是具有正态密度 n 的独立随机变贵，则 X /\ Y \ 有柯西密度 (4.5)； 其中 
t = l . 一些有关的密度见习埋5和习题 6.1 

r 密度的卷积性质 (2.3) 看来好像 （4.6) 式，但是有一个重大差别，即 r 密度 
的《是本质参数，而 (4.6) 式只含一个尺度参数.关于柯西密度的类型是稳定的.这 
种在卷积运算下的稳定性，为正态密度和柯西密度所共有；差别在于尺度参数分别 
具有法则 P 4和 t = h + 1 2 . 除此之外，还存在着有类似性质的其他稔定 

密度，用专门的术语来说，我们把正态密度和柯西密度分别称为“指标为2和1的 
对称稳定密度” .( 见 6.1 节 .） . 

( f ) 指标为^的单側稔定分布.如果饥是形如 (1.6) 的正态分布，则 

F a ( x ) = 2[1 - 9 l ( a / v / i )], ®>0, (4.7) 

确定了一个分布函数，它的密度是 

x>0 - _ 

显然它的期望不存在.这个分布已在第1卷 3.6 节 (6.8) 中出现，又在第1卷 10.1 
节中作为常返时间分布的极限而求出，并且这个推导隐含着合成法則 

f a *fp = A ， 其中 = £» + /?. (4.9) 

i 单 i 改€这;试»就得到卷积公式 （4.6) 的物理解释.我们的论证指出.如果把一个单位的光《 
放在《点，那么7«就表示光的强度沿着: cy 平面上直线》== t 的分布.于是 (4.6) 表示惠更斯 
(Huy^ns) 尿理，据此 M 理，光的强度沿着 y = » + t 的分布情形，似乎和光深在直线 tf = t±» 
密度分布时的情形相同 .( 我感谢沃尔什 （J. W. Walsh) 的这个解 #.) 
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(用初等但较麻烦的积分运算来验证也是可行的.用傅里叶分析来证明则比较简单 .） 
如果 X u …、 X n 是具有分布 (4.7) 的独立随机变量，则 (4.9) 式隐含着 ( A -1 + --- + 
X „) n ~ 2 与其有相同的分布，因此平均值 ( X x +-■+ X n ) n - i 似乎与 n 有相同的数 
世级； 在不收敛时，它们的增加将是无界的（参看习题7和习题 8). 

( g ) 形如 e -' a (* >0,«>0)的分布的出现与顒序统计童有关（见习埋 8). 它们和其 
变形1 - e — P-Tig 以韦布尔 ( Weibull ) 分布的名称（有点难以理解）出现在统计可赛性理论中. 

( h ) 逻辑 斯谛分 布函数 


«>0， （4.10) 

可用于预报.大量文献都试图建立一个直观的“逻辑播长律 * ;只要单位选得适当，实际上 
所有的增长过程都可用形如 (4.10) 式的函数表示.式中 t 表示时间.通过 X 2 对冗长的数 
表的检验支持了有关入类总体、细菌群体、铁路发展等问题符合此律.已经发现动植物的高 
度和二者都遵循逻辑律，虽然从理论上讲，很 明显， 这两个变 置不能 有同样的分布.实 
验室里关于细菌的试验表明，即使没有系统的影响也能出现其他的结果.总体理论依赖于 
逻辑外推法（即使它表明是不可靠的).在理论上仅有的矛盾是，不但逻辑分布，而且正态分 
布、柯西分布，还有其他分布，都可以适用于同一资料, ® 这一资料具有一致 的或较好的拟 
合 优度. 在这个竞赛中，与其他分布比较，逻辑分布并不起显著作用 •, 而大多数非逻辑分布 
的理论棋型却为同一观测资料所支持. 

这种仅从拟合程度出发用某种模 S 来描述总体的理论是短命的，因为它没有提供新的 
方法，并且对同一旧亊物所得到的各种新证实立即产生 矛盾. 但是，这种自然的推理并未 
被常识所代替.因此它有助于淸楚地说明单纯拟合优度是怎样使人发生误解的. 

2.5 随机化与混合 


令 F 是依赖于参数0的分布函数， U 是某个概率密度，则 

W ( x ) = J°° F ( x ,0) u (0) d 0 (5.1) 

是从0增加到1的 z 的单调函数，因而是一个分布 函数. 如果尸的连续密度为/, 
则灰的密度为心 ^ 

w ( x ) = J f ( x ,0) u (6) d 9. (5.2) 

① W. Feller, On the logistic law of growth and its empirical verifications in biology , Acta 
Biotheoretica , vol. 5 (1940), pp. 51-66. 
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代替关于密度《的积分，我们可以对离散概率分布 求和： 如果 e u e 2 ,- - 是任意选 
取的，且 Pfc > O . J^Pfe = 1,则 


w ( x ) 0fc ) p * (5-3) 

k 

定义了 一个新的概率密度.在概率上可以把这个步骤称为随机化 i 参数 (9 被作为随 
机变董，而新的概率分布被定义在 M 平面上，此平面就作为样本空间.形如 (5.3) 
式的密度称为混合密度.这个术语现在一般被用在形如 (5.1) 的分布和 (5.2) 的密度 
上. 

在此我们不打箅导出一般的理论,而是企图用几个例子来说明这个方法的应用 
范围及其概率 内容. 这些例子还可以作为条件概率概念的准备 . 2.6 节专门讨论由 
连续参数的随机化而得到的离散分布的例子.最后, 2.7 节说明出自随机游动的连续 
过程的构造；作为副产品，我们将得到一些分布，它们在许多应用中和需要严格的 
计算中经常出现. 

例 （ a ) 比.如果 X 是具有密度/的随机变撒， 则对于 固定的 y > 0,变董 X / y 的 
密度为 f { xy ) y . 将参数 y 视为密度为 g 的随机变董，我们得到一个新的密度 

—、= j f ( xy ) yg ( y ) dy . ( 5 . 4 ) 

此式和 (3.2) 相同，而 2.3 节的讨论就是以此为基础的. 

用概率的语言说，把 X / tf 中的分母 y 随机化指的就是考虑随机变量 X / Y , 我 
们仅仅再讲一下 X / Y 的密度 (3.2) 的推导.在这种特殊情形，术语是一个有趣的问 

题. 

例 （ b ) 随机和•令 Ai ， X 2 , …是具有相同密度/的独立随机变撤.和… 
+ X n 的密 度为尸•'即 /本身的 n 重卷积（见 1.2 节).项数 n 是-个参数.现在我 
们用概率分布 P{^V = n }= p „ 把它随 机化. 具有随机项数 TV 的总和的密度是 

W = [ PrJ n *. (5.5) 

1 

作为一例，取 { p „} 为几何分布 P „ = qp n -\ f 取指数 密度. 于是广=由 (2.2) 
式给出，且 

w (®) = qae ~ ax ^ 2 p n ~ 1 ^ _ 1 ^, = . (5.6) 

例 （ c ) 对排队的 应用. 考虑一个服务时间按指数分布（密度/⑷ = pe -^) 的服 
务员，假定来到的服务具有泊松型，即依次到达之间的时间是独立的且具有密度 
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Ae -^, A </ x - 这模型已在第1卷 17.7 节 （ b ) 中 叙述. 到达的颃客排成一条（可能是 
空的）“等待线”，按照到达的次序不间断地得到脤务. 

考虑某个顾客，在他到达时等待线上已有 n > 0个顾客.他在服务员那里所花 
的总时间，是这 n 个顾客所花的时间加上他自己被服务的时间的总和.这是一个具 
有密度 / (n+1) * 的随机变董.我们在第1卷 17.7 节 (7.10) 已经看到，在正常状态时， 
等待线上恰有 n 个顾客的概率等于 3 P "， 其中 p = A / m - 假定处在正常状态，我们 
看出，頋客在服务员那里花的总时间 T 是一个有下列密度的随机 变量： 

£ qp n / ( n +1) *( t ) = ㈣ f ^{ pnt) n /nl = (/*- 入)6-〜-〜*. 


因此 E(r) = A ).( 见习题 10.) 

例 （ d ) 公交车的等 待线. 假定公交车计划在每小时整开出一辆，但可能被耽误. 
我们把接连的耽误时间记为 X *,它作为具有共同的分布 F 和密度/的独立随机 
变贵. 为了简单起见，假定0 < X * < 1.以 A 表示在下午某时刻 a : < 1到达的人 
等待的 时间. 列入下午行车计划中的公交车巳经开出的概率为 F ( x ), 容易看出® 


P { T X < t } 



F(t + x )- F ( x ), 
l ~ F ( x ) + F { x ) F{t + x ~ l ), 


当 0 < « < 1 - z 时， 

当 1 - a : < t < 2 - * 时， 


(5-7) 


显然，当 t > 2 - a : 时， P { T X <0 = 1. 相应的密度为 

[ f(t + x ), 当 0< t < l -； E 时， 

\ F ( x ) f(t + x - l ), 当 l - x <*<2 - 


(5.8) 


这里到达时刻: r 是一个自由参数，把它随机化是很自然的.例如，对于“随机地” 
到达的乘客，他的到达时刻是一个在0：!中均匀分布的随机变 M . 此时期望等待时 
间为 |+< T 2 , 其中 <7 2 是耽误的方差.换句话说，如果公交车是准时开出的，那么 
期望等待时间最小，并且它随着耽误方差的增加而增加 .( 见习题11和习题 12.) 


2.6 离散分布 

本节致力于迅速地看一看二项分布和泊松分布随机化的一些结果.在贝努利 
试验中成功次数知的分布依赖于成功概率 P . 将 P 当作密度为 U 的随机变量，得 


① (5.7) 的后一等式不易#出，可用如下方式证.< t} = [Xi > *> U {Xi < *> n {X 2 < 
t + x - 1 }. ——译者注 
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到一个新的分布 


P { S n = fc } 



P fc (l - p ) n - k n { p ) dp , 


fc = 0, • _ • ， n. 


(6-1) 


例 （ a ) 当 t *( p ) = 1 时，由分部积分表明， ( 6 . 1 ) 式与 * 无关，且 （ 6 . 1 ), 化为离散均 
匀分布 P { S n = fc } = (n + I )- 1 .更好的说明是贝叶斯 ( Bayes ) 的论证：考虑 n + 1 
个在叮中均匀分布的独立变量 Xo ,- -, 义„.(6.1)式（式中« = 1)的积分等于在变 
贵&，…，中恰有 fc 个小于 X 。的概率，或者说，等于在诸点為，…,按数 
值大小的排列中，排在第 (k + 1 ) 位置上的 概率. 但是由于对称性，每个位置都 
是等可能的，因此积分等于 （n + I )" 1 . ► 

用赌博的语言来说， (6.1) 式对应于这种 情况： 随机地选取一个不均匀硬币，并 
用这种结构未知的硬币进行试验.在赌徒看来，试验不能认为是独立的.事实上，如 
果观察到很长的正面序列，那么下面的认识就变得自然了：对此硬币， P 接近于1, 
因而不妨赌更多次出现正面.这样两个范例可以说明这种类型的估计与预测问题. 
例 （ b ) 给定 n 次试验有 A : 次成功（等于假设 if), 问事件 p < a 的概率是多少？ 
根据条件概率的定义， 




"PW" 


f P fc (l - p ) n ~ k u { p)dp 
；/2 ___ 

f p fc (l-p)"- fc «(p)dp 

JO 


( 6 - 2 ) 


巴叶斯用到了具有 tt(p) = 1 的这类 估计. 我们的模型的结构（即在实际上，如果我 
们讨论的是具有已知密度 t * 的各种硬币总体）就适合这个程序.困难在于《当看到 


不是随机化的时候，它仍不分胄红皂白地被用来判断“原因的概 率”； 这一点巳在 
关于所谓“明天出太阳的概率”的问题（第1卷 5.2 节例⑷）中充分讨论过 • 

例 （ c ) 上面的一个变形可叙述 如下. 给定 n 次试验有 fc 次成功，问以后的 m 次 
试验中有 j 次成功的概率是多少？由前面的论证可得到下列 答案： 


{：)!： 


^ +fc (l -p)"*+"-i-* u (p)dp 


p fc (l -p) n - fc u(p)dp 


(6-3) 


(见习题 13.) ► 

转到泊松分布，我们把它解释为在长度为 t 的时间内，准点“到达”次数.期 
望到达次数是我们从概念上来说明两个不同的随机化方式. 
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例 （ d ) 随 机化的时间. 如果时间间隔的长度是一个具有密度 u 的随机变鲎，则恰 
有 fc 次到达的概率 Pt 是 

Pk = e ~ at ^- u ( t ) dt . (6.4) 

例如，如果时间间隔的长度是指数分布的，则 fc = 0, l r ••次新到达的概率等于 

这是一个几何分布. 

例 （ e ) 分层.假设有一些随机到达的能派，每个能源有泊松输出，但是参数不同. 
例如，植物在固定的曝光时间 t 内发生的偶然事件可以假定为泊松变量，但是参数 
将随各种植物而异.类似地，发生于个别单位的 电姑呼 叫可以是泊松变量，各个单 
位有不同的期望呼叫次数.在这过程中，参数《作为具有密度 u 的随机变量，在时 
间《内恰好 n 次到达的概率为 

Pn(t) = jT B- at ^-u{a)da. (6.6) 

对于 r 密度 U = f 0 , v + 1 这种特殊情形，我们有 

⑽十:卞点）（点) • （67) 

这是 波利亚 ( Polya ) 分布 的极限形式，此分布在第1卷 5.8 节习题24和第1卷 17.10 
节(10.2)( 令 = a - 1 ， W 1 - 1) 中给出 • 

关于俩 传染病的注-个奇特而有益的历史就联系到分布 （6.7) 及其两璽性. 

导致 (6.7) 式的波利亚罐子模型和波利亚过程是真传染病模型，其中每一个意外亊故 
的发生，确实增加了将来意外亊故的概串.这个棋型很车盛名，且 (6.7) 式在实际上适合于 
各种现象，用它来描述其 传染病的特征 是很适合的. 

同-汾布 (6.7) 早在1920年由格林伍徳 （ M _ Greenwood ) 和尤尔 （ G . U . Yule ) 同时推 
导出，他们的意见是，良好的拟合将联 斥了传柒病的 模塹. 其推导大体上等价于我们的分层 
模型，这棋型从强调泊松过程即假定没有后效 开始. 于是有一个惊人的亊实，同一分布的 
良好拟合可以用本质及实际含义都完全相反的方式来解释.这一点可以作为对那些将统计 
资料作过分轻率解释的忠吿. 

关于假传染病的现象的解释巳经在第1卷 5.2 节⑷中叙述了，并和上面 (6.1) 式有 
关.这样，在长度为《的时间内观察到 m 个意外事故，使我们可以用类似于 （6.3) 式，去估 
计在将来长度为 t 的时间内发生 n 个意外事故的概率.其结果将依赖于 m , 但是这种依赖 
性是由于抽样方法，而不是由于它的 本质； 关于过去的信息能使我们更好地预测样本的将 
来性质，而不会与整个总体的未来混同起来. 
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2.7 贝塞尔函数与随机游动 


在扩散理论、排队论和其他应用中相当多的显示解包含有贝塞尔 （ Bessel ) 函 
数.通常很少能明显地用解来表示概率分布，分析理论要求得出它们的拉普拉斯变 
换，而用其他关系则比较 复杂. 幸好，所讨论的（和更多的）分布可以用简单的随机 
化方法来获得.用这种方法可使关系式去掉了偶然性，从而避免许多困难的分析. 
阶为 p >- l 的贝塞尔兩數理解为对全体实数 a ： 定义的函数 / P ®. 

讲 )= g 师^(!广 卯) 

我们用三个方式来得出包含贝赛尔函数的三种不同类型分布. 

( a ) 随机化的 r 密度 

固定 p > -1, 考虑 (2.2) 式的 r 密度 / llP + fc + i . 令参数 fc 为服从泊松分布的整 
值随机变 M . 按照 (5.3), 我们得到一个新密度 

~ fk °° fk T P+k 

^ (x) = e-t g +1 ⑻= e — S kw( P +kTTy (7 - 2) 

比较 （7.1) 与 （7.2) 中各项，可以看出 

w p ( x ) = e -t_ * ^( x / t ) p I p ( 2y /^ c ), x > 0 . (7.3) 

如果 p > -1, 则是集中在5^5上的概率密度.（对于 p = -1,右边关于 a : 是不 
可积的 .） 注意， t 不是尺度参数，因此这些密度是属于不同类型的. 

顺便提一句，由这个构造和 r 密度的卷积公式 (2.3), 显然有 

* fi,u = Wp + u - (7.4) 

(b) 随机化的随机游动 

在讨论随机游动中，通常我们假设接连的跳跃发生在时刻 1 , 2 , -, 然而很清 
楚，这个约定仅使描述生动而已，棋型与时间完全无关.一个真正的时间连续随机 
过程是由普通的随机游动依下面规定而得出的：接连两次狭跃的间脒时间是具有 
相同密度 e -* 的独立随机 变量. 换句话说，跳跃时刻被一个泊松过程所 支配， 而跳 


①按照标准的用法，心是 •修正 的_贝塞尔 函数或 •具有虚自变量"的贝塞尔* 败. - a 常的 • 贝塞尔 
函败常 表示为心，它是在 (7.1) 式右边»入 (-1)* 来定义的.我们用术语贝塞尔* 败是一 个通用 
的称呼，而不含有新内容. 
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跃高度是分别以概率 p 和 g 取值+1和 -1 的随机变 M, 这些变量彼此独立并构成 
泊松过程. 

对于与随机游动有关的毎个分布，都对应于一个时间连续过程的分布，此过程 
在形式上是由跳跃次数的随机化而获得的.为此，我们详细地研究在给定时刻 * 上 
的位置.在基本的随机游动中，为使第 n 步到达位置 r^O, 当且仅当在前 n 次跳 
跃中， $(n + r) 是正的，|(«-»0是负的.这只有当《-1' = 2«/是偶数时才行.此 
时，在第 n 次跳跃后恰好处在位置的概率是 

( i ( „ V ) >* ( ■，〜 ( r r : 2 : >，.㈣ 

在我们的泊松过程中，直到时刻 < 恰好发生 n = 2»/+ 7 次跳跃的概率是 e ~ H n / n \, 
因此在我们的时间相关过程中，在时刻 t 处于位置 r > 0的概率等于 

e_t E J ^ y .{ r r + + u ) pr+l，p，/ = 爾（ 7 . 6 ) 

我们得到两个结论 | 

(i) 对于 r = 1,2,3,…，如果定义 /- r = _/r, 则对于固定的 <>0,p,9, 

Or(t) = v/(p/9) r e -t / r (2 > /pg*), r = 0,±l, ±2, • • •, (7.7) 

表示某个飙芈分布(即 Or > 0, Tor = 1). 

(ii) 在时间相关随机游动中，知⑴等于在时刻 t 处于位篁 r 的概率. 

两个贝塞尔函数的著名公式是这个结果的直接推论.首先，由变憊替换2# = 
z 和 p/g = u 2 , 恒等式 Sa r ( t ) = 1变为 

e ix(«+«-») = yri r ( x ). (7.8) 

这就是所谓的贝塞尔函数的母函数或施勒米希 (Schl6mikh) 公式(此公式有时作为心 
的定义). 

其次，由过程的本质显然可见，概率知⑴必须满足査普曼-科尔莫戈罗夫 
(Chapman-Kolmogorov) 方程 


Or{t + r) = a fc (t)Or_fc(T). 


(7.9) 
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此式 奉示， 在时刻 t 质点应当位于某一位置 fc 并从 fc 转移到 》•, 等价于从0转移到 
r - fc . 在 17.3 节中我们将再来讨论这个关系式 .[ 此式直接由表达式 (7.6) 和随机游 
动中类似的概率公式，容易得到验证 •] 査普曼-科尔莫戈罗夫方程 (7.9) 等价于 

/ r (t + T )= f ； I k (t)I r . k (T). (7.10) 

这就是著名的诺伊曼 （ K . Neumann ) 恒等式. 

( c ) 首次通过 

为了简单起见，我们把注意力放在对称的随机游动上，即 p = g = ^ 按照第1 
卷 3.7 节（7.5)，首次通过点 r > 0发生在第 2 n - r 次跳跃上的概率是 

六 ('_>•) 2 -， (7.1,) 

如果随机游动是常返的，则这样的首次通过以概率1发生，即对于固定的 T % 数勉 
(7.11) 相加得 1. 在我们的时间相关过程中，第 fc 次跳跃的时刻有 r 密度 （2.2) .由 
此得到，首次通过 》• > 0的时刻具有密度 



因此，⑴对于固定的 r = l ,2, …， 

Vr(t) = (7.13) 

定义了某个集中在0^5上的板芈 密度； 

( ii ) 首次通过 r > 0的时刻具有密度 tv (见习题 15). 

这个推导还有另一个有趣的 结论. 在时刻 t 首次通过 r + p , 蕴含着在某时刻 
8 < t 先首次通过 》•_ 由于在时间间隔 D 和5^中跳跃的独立性以及指数等待时间 
的缺乏记忆性，我们应有 

V r *Vp = v r+p . (7.14) 

[ 如果利用相应的卷积性质于概率 (7.11), 则由 (7.12) 通过计算验证 (7.14) 是容易 
的 •] 
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实际上，命题 （0 和关系式 (7.14) 对于所有取正值的参数 r 与 P 都是正确 

的.① 


2.8 圆上的分布 


半开区间可用来表示单位长的圆上的点，这比用整条线绕在圆周上更好. 
于是圆有了一个方向，弧长的值从 -oo 至 oo, 但 a: ， ;r±l ， a:±2, …应理解为同一 
点.加法运算的模是1,如同角的加法运算的模是 2 jt —样.在圓上的概牟密度是一 
个周期函數使 

J ifi(x)dx = 1 . ( 8 . 1 ) 

例 （ a ) 蒲丰 ( Buffon ) 投针问 超 (1777). 传统 的叙述 如下. 将平面分成为平行于 y 轴 
的宽度为1的若干带形.随机地投掷一根长度为1的针.问它穿过两个带形的概率 
是多少？为了说明问题，首先在形式上考虑针的中心.它的位置由两个坐标决定，但 
是 i / 不必考虑，并且把： r 按模1来缩减（即取 a ; 的小数部 分）. 这样，“针的中心” 
变成为圆上的具有均匀分布的随机变世 X . 针的方向可以用针与 j / 轴的夹角（依顺 
时针方向测董）来 确定. 针旋转了一个: t 角，又恢复到原来的位置，因此夹角仅可 
被确定直到 JI 的整 数倍. 我们用 Zn 来 表示. 在蒲丰投针问题中，可以推知 A ■和 Z 
是在长度为1的圆上均匀分布的独立变 M ®. 

如果我们选用0与1之间的值表示 A ■，- 1 与$之间的值表示那么为使针 
穿过边界，当且仅当 


•cosZn > A ■或 ^coeZn > 1 — X. 

对于给定在 一| 与$之间的 zm . XK ^ coszn 的概率和1 - X <去咖 zji 的概率 
相同，即等于 icos 因此，所要求的概率是 



cos zndz 


( 8 . 2 ) 


直线上的随机变量 A " 可按模1缩减以得到圆上的随机变量 X . 数值计算中的 


① W. Feller,Infinitely divisible distributiona and Bessel functions associated with random 
umlks, J. Soc. Indust. Appl. Math., vol.14 (1966), pp. 864—876. 

® 对價 (X,Z) 的样本空间是一个圔环面. 
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舍入 误差就 是这种类型的随机变 ft . 如果 X 有密度/,则的密度为® 

< P ( x ) = 5 Z /(^ + «)• (8.3) 


从而直线上的每一个密度导出圆上的一个密度.[由 19.5 节看出，利用傅里叶 ( Fourier ) 
级数，同 一¥> 允许有完全不同的表示式.对于正态密度的特殊情形，见 19.5 节例 
(e)-] 

例 （ b ) 庞加莱 ( Poincare ) 轮盘賭问超.研究轮盘的转动次数，把它看作集中在正 
半轴上具有密度/的随机变量 X . 观察最后的结果，即轮盘停下来的点 D X , 它是 
变量 X 按模1被缩减而得的变量.它的密度为 (8.3). 

我们自然会认为，“在通常的情况下”，的密度近乎是均匀的.在1912年，庞 
加莱在牢固的极限定理的基础上论证了这一含糊的认识.我们不重复这一分析，因 
为类似的结果容易从 （8.3) 式 推出. 当然，不言而喻，给定的密度/实际上是展伸 
到一个长的区间，因此它的极大值 m 最小的为了简单起见，假定在 a 点上/取 
到极大值 m = /( a ), 在 a 之前/增加，当 a : > a 时/减少.对于缅减变 M 的密 
度 则有 

< P (, x ) -l = ^2 f(x + n )~ f f ( s ) da . (8.4) 

对固定的 A 以;表示形如 z + n 使得 a + fc 彡 + 这样唯一的点.于 

是 (8.4) 可改写为 


00 fO+fe+l 

> p ( x )- l = ^2 / [/(® fc ) - f ( a )] d 8. (8.5) 


对于 fc <0, 被积函数 <0,因此 

屮⑻ -1 < 5 Z[/(o + k )- f(a + k +1 )] = /( a ) = m . 
k=0 

类似的论证表明 v >(®) - 1彡 - m . 于是 | V ( x ) - 1| < m , 因此妒确实接近常数. 

单调性条件只是为了说明问题而加的，它可以用许多方法减弱.【简洁的充分条 
件可用 19.5 节泊松求和公式得出 J 

① 对收敢性感到 困难的读者只18研究集中在有 R 区间上的密度 /. 如果/对于充分大的 * 与 -I 是 
单调的，则一致 收敢是 a 然的.没有对/加任何条件时，则级败在某些点上可能发«,但 v 恒表示 
密度，因为 (8.3) 式中的部分和表示一 个凾数 的单调序列，其积分趋于 1. ——译者注 
® 注意因/受 /(*) d * = 1 的限* 译者注 
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例 （ c ) 第1位有效數字的分布. 一位著名的应用数学家极其成功的工作，是发现 
在农历书、人口调査报告或类似的摘要数表中随机地选取个数，第一位有效数字小 
于 5. 我们自然想到，所有9个数字是等可能的，因此，数字不大于4的概率是 f 
在实际上^它接近于 0.7 . 

考虑一个賦于数宇以概率你= Ig ( A : + 1) - lgfc 的离散概率分布（式中 lg 表 
示以10为底的对数 ， fc = l ,---,9). 这些概率的近似值是 

Pi = 0.3010, P 2 = 0.1761,pa = 0.1249, p4 = 0.0969, ps = 0.0792, pa = 0.0669, P 7 = 
0.0580, pa = 0.0512, p 9 = 0.0458, 可见分布 {p k } 与含权 | = 0.111 • •- 的均匀分布 
有显著的差别. 

我们现在指出（依照 It S . Pinkham ), { p fc } 是由物理观测大 M 数据中，随机选 
出的数的第一个有效数字的经验分布，这似乎是对的.实际上，可以把它看作是具 
有某个未知分布的随机变贵 r > 0.为使 F 的第一个有效数字等于 ft , 当且仅当对 
于某个 n ，10 "fc < y < 10 "(fe + l ). 对于变量 X = lgy , 这意味着 

n + lgk ^ X <n + lg(k + 1). (8.6) 

如果 y 的取值范围很大，则缩减变憊将是近似于均匀分布的，于是 (8.6) 式的 
概率接近于 lg ( A ： + l)-lgfc = P *. 

当加法以1为槙时，卷积公式 (1.5) 和导出这公式的论证都保持正确.相应地， 
长度为1的 BO 上两个密度的卷积确定下列密度< 

W ( X 、 = Ja ~ V ^ 2 ^ dy， (8-7) 

如果 Xi 和 X 2 是具有密度 A 和/ 2 的独立变撤，则+ X 2 的密度为因为这 
些密度是周期的，所以 均匀密度和任一其他密度的卷积是均匀的 (见习题 16). 

2.9 习 题 

1. 证明 | 在第 1 卷第 7 章中所建立的二项分布的正态退近蕴含正态密度的卷积公式 (1.7). 

2. 利用变换 z = 求证 r ( i ) = # 

3. 勒让德 ( Legendre ) 的倍量 公式，对于卩=«/,由 (2.5) 式计算 

_____ r ( 2v ) = ^- l rMr(nu + i ). 

① 对于经驗资料 ，见 F. Benford, The law of anomalous numbers, Proc. Amer. Phlloe. Soc., 
vo).78(1938), pp. 551-572. 
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提示， 在0 < y < | 上利用变换 4 (y - j / 2 ) = s . 

4. 如果 《;(*) = 试求卷积 S * p 和 S * g * S 以及 〆 •- 

5. 令 x 和 y 独立且具有相同的柯西密度 7 i (*)(4.5). 试证：乘积 xy 的密度为 
2 JI - XV * 1 . 

提示： 不要求直接计算，只需注意 

0-1 = _1 _ 1 _ 

(1 + a)(a + a) — 1 + « a + s. 


6•试证，如果 2 1 4 * 

，⑻= */(*) = 

⑷考虑上题的变 tt ln | X | 和 lnl^li 

( b ) 直接利用代换# = t 和分解部分分式•(见 15.9 节的习@ 8.) 

7. 如果 X 有正态密度 n , 则显然 X - 3 有稳定密度 (4.8). 由此 证明 . 如果 X 和 K 是独 
立正态变 S , 有期望0,方差4及 d . 则 Z = AT / v ^ TY 5 是正态的，其方差为 

4满足丄=去+去 ( L . Shepp ). 

ff3 ^0. 

8. 令 Xu"-，X„ 是独立的，义(„)是其中最 大者. 证明< 如果 A 有 
( a ) 柯西密度 (4.5), WJ 

P[n~ l X in) e -" ㈣ ， x >0; 


( b ) 稳定密度 （4.8), 则 

P{n- 3 X (n) ^x}-* e—V 5 ^ ， *>0. 


9. 令 A ■和 K 独立，具有集中在 07石 上的密度/和 t 如果 E ( X ) < 00,则为使比 X/Y 

有有限期望，当且仅当 i 

/ y -1 s(y)dy < oo. 

Jo 

10 . 在 2.5 节例 （ c ) 中 ， （ a ) 如果在时刻0脤务员空闲着 ， （ b ) 在稳定状况下，求出直到下 
次版务完成 应等待的时间 • 

11. 在 2.5 节例 （ d ) 中，证明 

E ( T ,) = F ( i )(#* +\-x) + J' *t/(t + *) dt , 

其中# 是尸 的 期望. 由此验证当 * 是均匀分布时关于 E ( T ) 的断言 • 

12. 在 2.5 节例 （ d ) 中.当0 < t < 1时，/⑺=1,试求等待时间分布 • 

13. 在 2.6 节例 （ c ) 中，假设 ti 是由（4. 2 )给出的0密度.试用二项系数求条件概率 （6-3) 
的值. 
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14.令 A ： 和 y 独立，相同的泊松分布为 P[X = n }= e -* i n / n !, 证明 
P{X - y = r > = e -2 */| r |(2 t ), r = 0, 土 1， 士 2 …. 


(见 5.1 节习题 9.) 

15. 2.7 节 （ c ) 的诸结果对于非对称随机游动仍然正确，只要首次通过 r > 0的概率等于 
1,即只要 p > q . 证明 ，在 (7.11) 式中的唯一变化是把 2- 3 n + r 换为 p n q n ~ r , 并且对 
于？> g，r = 1,2,…， 

V ， (p/fl) r e _ *^/r(2 v /pgt) 

确定了集中在 t > 0上的概率密度. 

16. 令 x 和 y 独立， ox 和 Y 是以1为模缩减的 变世. 证明 ， ox + Y 是把 x + y 按模 
为1缩减而得到的.用直接计舞:来验证相应的卷积公式. 
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由于明显的原因，多元分布比一元分布更不经常出现，而且本章的素材在后面 
各章中很少用到.然而，多元分布却包含了许多重要的素材，例如正态分布的重要 
特性和在随机过程理论中所用到的一些工具.当把它们同与其有关的复杂问题区 
分时，我们就能更好地理解它们的本质. 


3.1 密 度 

为了印刷上的简便，我们在笛卡儿平面 R 2 上讨论，但显然维数不是本质的. 
我们把平面看作是具有坐标变董 X U X 2 的确定坐标系（更为方便的单个宇母的记 
法将在 3.5 节中引入). 

定义在 R 2 上且积分等于1的非负可积函数/称为概牟密度，或者简称为密 
度（本章出现的所有密度都是分段连续的，因此积分的概念不要求说明).密度/賦 
予区域以概率 

P{^} = JJ f(xi,x 2 )dxidx2. (1.1) 

n 

当然，为使积分存在，假定是充分规则的.所有这样的概率都由平行于坐标轴的 
矩形的概率，即由下式唯一 确定： 

P{oi < Xj ^ 6i ,02 < Xj < 6a} = J j /(xi,X2)d*idx2, (1.2) 

其中 Oi < bi 是任意 实数. 令 = a 2 = - oo , 我们得到 / 的分布函數 F , 即 

F { x x , x 2 ) = P{Xi < x \, X 2 ^ x 2 }. (1.3) 

显然， F ( b 1 , x 2 )- F { a u x 2 ) 是宽度为 fti - ax 的半有限带形的概率，并且在 （1.2) 式 
中出现的矩形是两个这样的带形之差，概率 (1.2) 等于所谓的混合差 

F ( bi , b 2) - 尸(<» 1 ， 62 ) — F ( bi , a 2) — F ( aj , a 2). 

由此可知，分布函数 F 唯一地确定了所有的概率 (1.1). 不管与直线的情形形式上 
如何类似，分布函数 F 的概念在平面上比较少用，而且最好都用密度本身确定概 
率 (1.1). 这种确定概率的方式在两方面与两个离散随机变量的联合概率分布（第1 



卷 9.1 节）不同.首先，积分代替了 求和； 其次，在这里概率只賦予“充分规则的区 
域' 然而在离散样本空间中，所有的集合都有概率.因为本章仅讨论差别不甚明显 
的简单例子，所以离散理论的概念和术语可以不言自明的方式照嫌过来.因此，和 
上一章一样，我们使用概率论语言，而不对 一般理 论作任何讨论（一般理论将在第 
5章中给出). 

由 (1.3) 式显而易见, ® 

(L4) 

因此， F 1 ( x ) = F ( x , oo ) 确定了 A 的分布函数，它的密度八为 


当需要强调与对偶 ( X U X 2 ) 之间的联系时，我们 又把巧 说成是边缘分 布®,八 
说成是边缘密度. 

A"! 的期望叱与方差 <7? (如果它们存在）是 

= E ( X !) = f f xif [ x 1 , x 2 ) da 1 dx 2 (1.6) 

J —oo J —oo 

与 +00 

a\ = Var(J^i) = J j (*i - Hi) 2 f(x!,x 3 )dxidx2. (1.7) 

由对称性，这些定义也适用于 X 2 . 最后，和的终方差是 

r+oo 疒 +oo 

Cov(Xi,X 2 )= / J (* 1 -M1)(*3-M 2 )/(*i ， * 2 )da ： idx 2 . (1.8) 


正规 化变撤 是无单位世，它们的协方差即 p = Cov^.XayfVj 1 是； ^和 
X 2 的相关系敷(见第1卷 9.8 节) • 

随机变量1/是坐标变璧X:和的函数，而且我们暂时只考虑概率 P { U ^ t } 
可以用形如 (1.1) 的积分来计算的那些函数.因此，每一个随机变童将有唯一的分 
布函数，而且每一对随机变董有一个联合分布，等等. 

在许多情况下，变换坐标变量是方便的，即令两个变量 Vi，y 2 起着原先:^，义 2 
所起的作用.在最简单的情况下，6定义为线性变换^ 


■Xi = Onli + 012^2) ^2 = 021^1 + 022^2, (1.9) 

①这里和以后当I — oo 时， U(oo) = 符号 (7(00) 的利用蘊含着极限的存在 • 

® 在坐标袖上的投澎是另一种可接受的术语. 
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它的行列式厶= 0 11022 -0 12 0 21 >0. 一般说来，形如 (1.9) 的变换，或者可以描述 
为从一个平面到另一个平面的映射，或者播述为在同一平面上的坐标变换.把变换 
(1.9) 代入积分 (1.1), 我们得到 

P{^} = JJ /(aui/i + any2,a2iyi + a 22 y2) - ddj/idj/2, (1.10) 

n . 

区域 a 由所有这样的点(奶 ,1/2) 组成，它的像 ( H . X 3) 在 a 中. 因为事件 { XuX 2 ) & 
a 和 ( yi , y 2 ) G / 2 . 是相 等的， 可见 ( yi , y 2 ) 的联合密度 由下式给出： 

5(1/1 ， 1/2) = /(OllJ/1 +<Xi2l/2,02 1 J/ l + d22l»2) . 4. (l.ll) 

所有这些都同样适用于高维 情形. 

除了行列式4换成雅可比 ( Jacobi ) 行列式以外，类似的论证适用于更一般的 
变换.我们将只明显地利 用极坐标变换 

Xi = iZcos 0, = Rsin 0, (1.12) 

其中 ( R , 6 ) 局限于这里 （ fl ,0) 的密度由下式给出 < 

g(r, 6) = /(rco60,r8in0)r. (1.13) 

在三维的情形中，我们利用地理经度 p 和纬度 < 其中 ->*<¥» 彡 n 和 

5")- 于是在极坐标中，坐标变量定义为 

X \ = Rcob ^ cos 0, X2 = iisin ^cos 0, X3 = J ? ain 0. (1.14) 

对于它们的联合密度，我们有 

g ( r , ip ,0) = f(r cosipco 80, rain < ficoaO,r sin 0) r a cob 0. (1.15) 

在变换 (1.14) 中， •■平 面” 0 = 和0 = 相应于叼方向上的半轴，但是这个 
特点不起作用，因为这些半轴有零 概率. 类似的陈述适用于平面极坐标系的原点 • 
例 （ a ) 独立的变量在上一章中，我们考虑了具有密度 A 和/ 2 的七立变量;^和 
X2 - 这相当于以 Hx 1 , x 3 ) = f 1 ( x 1 ) f 2 { x 3 ) 来定义二元密度，/<表示边缘密度. 

例 （ b ) “随机选点”令 r 是一个有界区域；为了简单起见，我们假设 r 是凸的. 
以7表示尸的面积，设/在尸内等于7- 1 ,在尸外等于 0. 于是/是一个密度， 
任一区域 flcr 的概率等于 n 与 r 的面积之比.显然，类似于一维的情形，我们 
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说对偶 (x u x 2 ) 在 r 上是均匀分布的.用直观的语言来说，&在楢坐标町上的 
边缘密度等于 r 在:^上的 宽度. （见习题 1.) 

例 （ c ) 球面上的均匀分布.在三维空间中，单位球面 i ； 可用地理经度#和纬度 
0 由下列方程表示^ 


X % = cosipcoaO , X2 = shupcoBO , X3 = sind . (1.16) 

满足 一n < V < < d < $»! 的每一对偶 (<p,0), 恰对应于球面上一点，并且 

除了两个极点外， r 上的每个点都可以这样 得到. 两极点的特殊作用不需要我们关 
心，因为它们的概率为 0. 球面上的区域/?由它在私平面上的像确定，/2的面积 
等于 cosMvxW 在这个像上的积分[见 (1.15)). 对于 ••在 i7 上的点随机选取”这一 
理想试验，我们将令 4nP{l?} = (2 的面积.这等价于在％ P 平面上定义密度 


{ (4 ji ) -1 cos 0,对 ' 一 Jt < 屮彡 n , 
0, 对其他值. 


m < \n, 


(1.17) 


按照这样的定义，坐标变*是独立的，经度在^上是均匀分布的. 

把球面看作平面的方法，在地图上常用，而且对概率论是有 用的. 但是 
要注意，坐标变 M 是很任意的，它们的期望与方差对于原先的理想实验毫无意义. 
例 （ d ) 二维正态密度.髙维正态密度将在 3.6 节系统地引入.先考虑二维情形，因 
为它提供了容易得出这个分布的方法.与 2.2 节， (2.1) 的正态密度 rj 相类似的是形 
如 •^的密度,其中 q ( x u x 2 ) = an ? + 26 x ia：2 + a 2 xl . 容易看出，为使 e _« 

是可积的，当且仅当巧是正的，并且 ( naa -6 2 >0. 从概率论的意义来看，用它的 
方差来表示系数叫和6,并且定义以原点为中心的以下二睢正态密度会更好一些， 

咖’叼) = 一二 - ■广 (_ _ d )] ， （1 . 18) 


其中 <71 > 0,<7 2 > 0,-1 < p < 1. 关于 Z 2 的积分容易通过代换< = *2/< T 3 - PX \/< T \ 
来进行（完成平方)，由此可见 P 确实表示 R 2 上的密度.此外，很明显， Ai 和尤2 
的边缘分布也是正 态的① ，且 E ( X <) = 0, Var (不） = <^, Coy ( XuX 2 ) = 叫例 . 换句 
话说， P 是不和為的相关系数•在 (1.18) 式中把〜换为 *< - Cj , 就得到以点 
( ci . ca ) 为中心的正态密度. 

①与通常的看法相反,存在非正态二维密度，它 A 有正态边缘密度（在习 * 2和习題3中叙述两种类 
SU 在 5.X2 节的习厘5和习 * 7中再叙述两种类型).在希®处理正态密度时，统计学家们有时引 
入一对新的正态分布的坐标变 量 Vi = Y a = 93(X3). 但是这 也不* 使 ( Y U Y 2 ) 的联合 

分布是正态的. 



62 第 3 幸高维密度、正态密度与正态过程 


重要的是， 线性变换 （1.9) 把 一个正态分布变成另一正态分布. 这从定义和 
(1.11) 式来看是显然的[在 3.2 节例⑷中继续讨论 j . 

例 （e) R 2 中的对称柯西分布 •令 


咖 ’* 2 ) = 5 • ^i + X 2 + ^y 


(119) 


为了看出这是一个密度，注意 ® 

/ +°° 11 y 1+00 

-oo 咖 ， 5 . TTi? . 7i^ + y aL 
1 1 
= n ' TT ^' 


( 1 . 20 ) 


由此推出， u 是密度且 Xi 的边缘密度是 2.4 节 (4.5) 的村西密度 7i. 显然 A": 没有 
期望. 

化为极坐标后[如 (1.12)], R 具有与0无关的密度，因此变量 R 和 ©是 
随机独 立的. 因此利用 1.10 节中的术语，我们可以说，对于对称柯西分布的变 
最, （A，^) 表示一个随机选梓方向的向量，向 i： 的长为 i?， ft 的密度为 々(1 + r 2 )- 3 , 
由此 

P{1? < r} = 1 - v/(l + r3)-i. 

[在 3.2 节例 （c) 中继续讨论 .j 
例 （f) R 3 中的对称柯西分布 .令 

v(xi,x 2 ,x 3 ) = ^ - {l + x ^ x 2 + x ^- (1.21) 


容易看 出®, ( X lt X 2 ) 的边缘密度是 (1.19) 的对称 柯西密 度 u . 因此，&的边缘密 
度是柯西密度 71( 在习题5中继续讨论). ► 

应该提到.我们可以像一维情形那样定义 卷枳，虽 然以后它不起显著的作用. 
考虑两个分别 具有联 合密度 f 和 g 的对偶和 ( Y u Y 2 ). 两个对偶是独 
立的，是指我们取含有坐标变童的四维空间作为样本空间，并在其 
中定义一个由乘积 f ( x 1 , X2 ) g ( y 1 , y 2 ) 给出的密度.如同 R 1 中一样，容易看出，和 
(^+^,^2 + ^) 的联合密度 p 由下列卷积公式给出， 

r+oo r+oo 

v(zi,Z 2 ) = / j f(zi - xi,Z 2 - x 2 )g(xi,x 2 )dxidx 2 , (1.22) 


它显然类似于 l . 2 节（2.12)(见习题15 〜习题 17). 
①为便于计算，作变换» = y/l + a ^ Umt . 

® 利用代换 Z = yjx + xf + xj tan t . 
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3.2 条件分布 

假定对偶 (X lt x 2 ) 有连续密度/. X ,的边缘密度 A 是严格正的.研究在给定 
+ 下事件 X 2 ^ r , 的条件概率，即 

〆+* 广 *7 

/ dx I f(x,y)dy 

P{X^ V \^<X 1 ^^ + h} = J( J h -°° - • ( 2 . 1 ) 

乂 fi{x)dx 

把分子和分母同除以 fc , 我们看出，当 h -0 时，右边趋于 

对于固定的这是 T ? 的一个分布函数，它的密度为 

««(»?) = (2.3) 

我们称忾为在给定 Xi = 6 T X 2 的条件密度.在给定 A = f 下 X 2 的条件期望 
定义为 

E(X 2 |Xi = 0 = J y/(€,y)dy, (2.4) 

只要积分绝对收敛.如果把《看作是变童，那么右边变成它的函数.特别，我们可 
以把 C 和坐标变董义1等同起来，就得到一个随机变世，称为&在 Xi 上的回归， 
用 E ^ lJfO 表示 • X 2 的出现并不掩盖下列 事实， 这个随机变贵是单个变 M A 的 
函数[它的值由 (2.4) 式给出 1. 

迄今我们假设，对于所有的 C ,/ i ( O >0. (2.4) 式对于使 M 0 = 0的任何点都 
是无意义的，但是这样的点的集合的概率为0,我们约定在使 h 为0 的所有点上 
(2.4) 式为 0. 因此，当密度连续时， E ^ alXj ) 是确定的（在 5.9 节~5.11节中将对 
任意的分布引进条件概率). 

无疑， A 在 X 2 烟回归 EJXilXa ) 可同样地定义.此外，条件方差 
用与 （2.4) 式完全类似的公式定义. 

这些定义可以扩展到髙维中去，除了 R 3 中的密度产生3个二元与3个一元 
条件概率以外（见习题 6). 

例 （ a ) 正态 密度. 对于密度 (1.18), 显然有 


u «( y ) 



exp 


(y - p(g2ki)€) 2 ' 

2 ( 1 ■ • 
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这是一个具有期望 P (内 /灼)€与方差 （1 _ 的正态密度.于是 

E(Jf 2 |X!) = = (1 - p 2 )ai ， (2.6) 

正态分布的令人满意的性质之一就是回归 为线性 函数. 

这些关系式的最早应用也许应归于高尔顿 ( Galton ), 他的例子中的一个可以说 
明它们 的经验意义. 设想义：和 X 2 表示人类总体中父亲和儿子的髙度（以英寸为 
单位，在测量中减去各自的期望).于是，随机选出的一个儿子的高度是期望为0、 
方差为4的正态变量.但是，在父亲有固定高度《的儿子的子总体中，儿子们的 
高度是期望为方差为 4(1 - p 2 ) < ( r | 的正态变董.因此， X 2 在 Xi 上 
的回归表明，在的观察值中包含着多少关于 X 2 的统计信息. 

例 （ b ) 令&和久 2 是独立的，且在0^内均匀分布，以 A ■⑴ 表示它们之中最小 
者 . 表示其中最大者.对偶 ( X (1) , X W ) 的密度在三角形0< 巧 < 勿< 1内等 
于常数2,在其他地方为0.对 a 的积分表明 X ⑴的边缘密度为 2(1 - &). 因此， 
在给定 X ⑴ =町下，义 (2) 的条件密度在区间5^71内等于常数1/1 - 町，在其他地 
方等于 0. 换句话说，给定了 的一个值 a , 变贵 A > 2) 在57^上是均匀分布的. 
例 （ c ) R 2 中的柯西 分布. 对于二维密度 (1-19), X x 的边缘密度在 (1.20) 式中给 
出.因此，在给定下 X 2 的条件密度是 

U((v) = 2 ' v/(l+d 2 ) 3 . (2 . 7) 

注意，叫与密度 uo ( y ) 仅差一个尺度因子 v / i + F . 因此，所有的密度汽厲同一类 
型.在这个例子中，条件期望不存在（见习题 6). ► 

按照条件密度 (2.3), X 2 的分布函数取下列形 Si 

P { X 2 < y }= f f u ( ( rj ) - / i ( C ) d ^ d » 7 . (2.8) 

J —oo J —oo 

换句话说， x 2 的分布是由在条件密度中对参数 （ 的随机化而得到的.因此，每 
一分布①都可以表示为混合 分布. 尽管在理论上这是很有普遍性的，但是强调各有 
不同. 在某些情形 [如例 （ a )], 我们由 ( X l , X 2 ) 的二元分布开始，导出条件分布，然 
而在实际的随机化中，条件概率 W 是最初的概念，而密度 /( a :， y ) 实际上被定义为 
〜 ( WAOcK 这种用条件概率来定义概率的方式已在第1卷 5.2 节中用初等方法说明 
过). 


①迄今我们只考虑了连续密度，而一般情形将包含在 5.9 节中. fit 机化*念曾在 2.5 节中讨 论过. 
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3.3 再论指数分布和均匀分布 


本节的目的是为上节提供说明性的例子，同时补充第1章的理论. 

例 （ a ) 指數分布的一个 特性. 令尤 i 和 X 2 是两个具有密度 A 和/ 2 的独立随机 
变董，以3表示它们的和 S = Xi + X 2 的密度.对偁 （ X ^ S ) 和 { X lt X 2 ) 以行列式 
为1的线性变换 Xi = X U X 2 = S - X , 相互联系，由 （1.11) 式，对偶 ( Jfi . S ) 的联 
合密度由 fi ( x)Ms - x ) 给出.对所有 rr 积分，我们得到 S 的边缘密度在给定 
5 = «下， X !的条件密度 w 满足 

= (3,) 

在指数密度的特殊情形 / i (*) = / 2 (*) = 2 e -<« 下（其中 a : > 0), 我们得到：对 
于0 < a : < 8, u t ( x ) = 8~ 1 . 换句话说，给定 Xi + X a = s , 变贵义丨在区间0^1内是 
均匀分布的.直观而言，5 = s 的知识并没有给我们提示随机点在区间^内的 
可能位置.这个结果与指数分布中固有的完全随机性的概念是一致的（一种 更强的 
形式包含在例 （ d ) 中. 参见习题 12). 

例 （ b ) 区间 的随机 划分. 令…,是在（一维）区间 0，1 内独立且随机地 
选取的 n 个点. 如前所述，我们以 X (1) l X ( a ) ,---, X (n) 表示按增加的顺序重新排 
列的随机点 Xi ,- -, X n . 这些点把区间 07 T 分成 n + 1 个子空间，将它们从左向 
右编号表示为 / i ,/ a ,•••,/„+!, 因此是心的右端点.我们的第一目的是计算 
( X ⑴，…, X („)) 的联合密度. 

相应于 ( X ir --, X n ) 的样本空间是以0 < 办< 1定义的 n 维超正方体 r , 概 
率等于 n 维体积.以为坐标变 fi 的自然样本空间是 r 的子集它包含所有 
这样 的点： 


n 的体积是 1/ni 显然，超正方体 r 包含 M ! 个集合 a 的全等仿样.在每个仿样中， 
有序的 n 元组 （X ⑴， • • . , X ⑻) 与 x u …， x „ 的一个固定排列一致 （特 别，在 r 内 
x {k) = X k ). 对于某一对偶 JV k,Xi = X k 的概率等于0,并且只有这个事件在 
不同的仿样之间引起相交.由此推出，对于任一子集合 4 c ⑴，…, 々„))位 
于力中的概率等于 ( X lt ---, X n ) 位于 T »! 个4的仿样之一中的概率，它也等于 A 
的体积的 n ! 倍.因此， P {( X (1 ) ，…， e 4} 等于4的体积与 I ?的体积比，它表 
示 n 元组 （X ⑴， ■..，'„>)在集合上是均匀分 布的. 我们的 n 元数组的联合密度 
在 D 内等于 n !, 而在其他地方等于 0. 
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由 ( X u …， X „、 的联合密度，保持為固定而对其余的变量进行积分，可以计 
算的密度.容易看出，此结果与在 1.7 节 (7.2) 式中用其他方法计算得出的密 
度一致 • 

这个例子作为讨论和计算多元密度的练习，已被详细论述过. 

例 （ c ) 长度的分布.在上例的随机划分中，以 17* 表示第 fc 个区间的长度，则 

Ui = X ( i),Uk = X ^) — A ： = 2,3, ■ • • , n . (3.2) 

这是一个行列式为 1 的形如 （1.9) 的线性 变换. 点0 < an <…< 1的集合 
被映入点〜 >0 ， Ul + -" + u „ <1的集合 /?•, 因此 （ R ，…，1/„) 在这个区域内是均 
匀分 布的. 这个结果比以前建立的14有相同的分布函数要强 （1.7 节例 （ b ) 和 1.13 
节中的习题 .)• 

例 （ d ) 指數分布随机性的进一步讨论.令义，…，是具有相同密度 ae -«(： c > 
0) 的独立变量. 令為 =不+…+ 则利用形如 (1.9) 式的行列式为1的线 
性变换，由 （ Ai , …, X „ +1 ) 可得 dSvJn + d 以表示点％ > 0的“卦 
限” ( octant )^,•••, X n+1 ) 的密度集中在上，并由下式给出： 

a n + 1 e - a (* 1 — + *»+0 ， Xj >0. 

变董 S ! ，… ，5 n +1 把《映到由0< < s 2 < …彡 « n+1 < oo 确定的区域/2•内， 

并且 [见 （1.11) 式1在 •内 ( Su -'^ Sn + l ) 的密度为 an + k -。*"' 巳知 S „ +1 的边 
缘密度是 I ’密度 Q n+is»e- a */n!. 因此 在给定 Sn+1 = a 下 n 元組 （ S u …， S „) 的条 
件密度， §()<&<••.<〜<* 时等于 n !«_" (其 他地 方等于 0). 换句话说，给定 
5„+1 = a , 变董 (5 i ,---,5„) 在它们的可能区域上是均勻分布的.把这与例 （ b ) 比较， 
我们可以说， 给定 5 „+i = s , 变量 ( Si ,---, S „) 表示在区间 0^1 内随机独立地选出 
并按其自然顺序从左到右编号的 n 个点. 

例 （ e ) 与指數分布有关的另一 分布. 为了特殊的应用，我们给出变换的进一步的 
例子.再令 X u …， X „ 是具有相同指数分布的独立变量 ，且氏 = X 1 + ... + X „ .考 
虑由下式定义的变董… 

14 = Xk / S „, 当 fe = 1, •••,«- 1 Bt , (3.3) 

U n = S n , 

或者等价地考虑 

Xk = U k U n ，当 *<n 时， (3.4) 

X n = U n (l — U \ —…— U n - i ). 
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(3.4) 式的雅可比行列式等于 t /"- 1 - (^ i , ■■■, X n ) 的联合密度集中在办 > 0确定的 
区域上，并且在此区域上，密度为 tt n e - a ( x 1+ -..+ x n ). 由此推出，在由 

«1 + -'- + tin-1 < 1, Ufc > o , k = l,-- ,n 

所确定的区域上， ( Ui , --, U n ) 的联合密度为而在外为0•关 
于如 进行积分表明 ， (Uu --, Un - i ) 的联合密度在上等于 （ n - 1)1, 在其他地 
方等于 0. 与例 （ c ) 比较，我们看出，职，…， 队-^的联合分布与用 r»-l 个点随机 
划分瓦 T 得出的第 fc 个区间的长度的分布一样. 

例 （ f ) 周期分析中的显著性检验与覆 ▲定 理. 在实践中，时间 < 的任一连续函数 
都可以用三角多项式逼近.如果此函数是随机过程的样本函数，那么系数变成随机 
变贵，逼近的多项式可以写成形式 

y^(_Y p cosoj v t + Y v sink ； v t) = 2^ Rv ctx(u v t - #„)， (3.5) 

其中用 =# + y u 2 , tan ^ = YJX V . 反之，对于随机变量 X V , Y V 的合理假设将导 
致一个具有样本函数 (3.5) 的随机过程.一个时期流行的是，引入这种形式的模型， 
并检验太阳黑子、小麦价格、诗歌创作等的“隐蔽周期性”.这种隐蔽周期性早在 
中世纪时期就已发现，但是甚至坚强的信念也需要用统计检验去加以巩固.此方法 
大体上可叙述 如下： 具有适当选择的频率 W !,--•,<*;„ 的形如 (3.5) 式的三角多项式 
适合于某些观测数据，且最大的振幅私也被观测到.我们想要证明，这不能归因 
干偶然事件，因此是一个真实周期.为了检验这一猜想，我们问，无论哪一个 
Rv 的大的观测值是否都不与“所有 n 个分董起相同作用”的假设发生矛盾.为了 
检验，我们相应地假设，系数 X u -, Y n 是具有期望0与方差^的相同正态分布 
的相互独立变量.在这种情形（见 2.3 节）下 ，相 是相互独立的，具有期望2 〆 的 
相同指数 分布. 如果观测值显著地”偏离这个预测的期望值，通常会匆匆作出 
结论： 相等权重的假设是站不住脚的，凡表示了 •■隐 蔽周期性”. 

这一推理的错误是 R . A . 费希尔 ( Fisher )(1929) 发现的.他指出： n 个独立观测 
值的最大值，并不服从毎个变量分别取出时的同一概率分布.处理统计学上最坏情 
况所得的误差（如果它是随机地选取的）在医学统计中仍是很通常的，但是在这里 
讨论这个问题的理由却是出人意外的，并且它有趣地联系着费希尔的显著性检验 
与覆盖定理. 

正如仅考虑各个分量比是有意义的一样，为使系数正规化，我们令 

v i = R 2 + Rj . + R 2^ 3 = 1, -,n. (3.6) 
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因为丐具有相同的指数分布，所以我们可以利用上例（令= g ). 于是 Vi == 

= 但是 V „ = l - C 7 i -因此 ， n 元组 ( Vi , …， V „) 的 

分布， 可作为 n -1 个随机分布的点划分区间 叮 得到的 n 个区间长度的分布.因 
此，所有的 &小于 a 的概芈，由 I . 9 节 (9.9) 覆盖定理的公式给出. 这个结果说明 
了表面上没有联系的问题之间会出现意的关系 .® ► 

*3.4 正态分布的特征 

考虑坐标变 董的非 退化线性变换 

yi = OnXl + 012X2 , Yl = < 121X1 + 033 ^ 2 . (4.1) 

并假定（不失一般性)行列式4 = 1.如果和 X 2 是具有方差 CT ? 与4的独立正 
态变 M , 那么对偶 ( Yi , Y 2 ) 的分布是正态的，且具有协方差 

011021^1 + 012022^2 

[见 3.1 节例 （ d )]. 在这种情形下，存在着系数 a , t 的非平凡选择，使得 K 和 K 是 
独 立的. 下列定理 表明， 任何 其他的分布部不具有 一维正态分布的这个性质.这里 
我们只对具有连续密度的分布来证明，在这种情形下，它化为一个关于函数方程 
(4.3) 的 引理. 通过利用特征函数，最一般的情形可化为同一方程.因此，我们的证 
明 实际上在最大的一般性上得到了这个定理（见 15.8 节). 密度的初等论述较好地 
显示出定理的根据. 

仅当没有一个系数为0时，变换 (4.1) 才有 意义. 实际上，例如假定 a u = 0. 
不失一般性，我们可以这样选取尺度参数，使得 a 12 = 1•那么 ， h =妁.只要看一 
看 (4, 4), 就知道在这种情形下， K 和 Xi 应当有相同的密度.换句话说，这种变换 
只不过相出于给变贵重新命名，因而无需再考虑. 

定理 飯定 Xi 和 X 2 相互独立，并且 Yx , Y 2 也是独 立的. 如果没有一个系數 a i(1 
为 0, 則所有这 4 个变量都是正态的. 

(4.1) 式最有趣的特殊情形是由旋转引起的，即由如下的变换引 起的， 

Yi = X \ coscj + 叉 2 sin w ， 的 =—Xy sinu * + X2oaaui , (4.2) 

①费希尔在 1929 年不用*羞定理的知识.导出了 中最大项的分布，而在 W. L. 斯薄 ■文 证明了 

覆 盖定理以后，费希尔又在1940年说明了与*遵定理的等价性（见 Fisher's Contnbutions to 
Mathematical Statistiai, John Wiley, New York (1950) 中第 16 篇与第 37 篇论 文). 对于用傅 
里叶分析的另一推导，见格雷南德与罗森布拉特 （U. Grenander and M. Rosenblatt)(1957). 

* 有星号的诸节对理解下文是不需要的，初读时可略去. 
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其中 w 不是&的倍数.应用此定理于这种情形，我们得到以下的 • 

系如果义丨和 X 2 是独立的，并且存在一个旋转 (4.2) 使得 K 和 R 也是独立的， 
則 Xi 和义 2 具有正态分布，且具有相同的方差.在这种情形下， yi 和 y 2 对每个 w 
都是独立的. 

例麦克斯韦的速度分布. 在研究分子在 R 3 中的速度分布时，麦克斯韦假设，在 
每个笛卡儿 ( Cartesian ) 坐标系中，速度的 3 个分量是期望为 0 的相互独立随机变 
董. 应用旋转（留一个轴固定)，我们的系立即表明 ， 3 个分童是正态分布的，且具 
有相同的方差.正如我们在 2.3 节中所看到的，这暗示了麦克斯韦的速度分布. 

这个定理有一段溲长的历史，可追溯到麦克斯韦的研究.纯粹的概率研究由卡 
茨 （ M . Kac )(1940) 和 S . 伯因斯坦 (1941) 开始，他们假定有限方差而证明了我们的 
系.许多作者常常用比较高深的方法致力于定理的改进和变形，在 V . P . 斯基托维 
奇®证明的结果中达到了顶点. 

现在，在连续密度的情形下进行证明.我们分别以和/,来表示 X ,和&的 
密度.为简略起见，我们令 

Vi = OnXi + 012X2 , V2 = anXi + a 22 i 2_ (4.3) 

在定理的条件下必须有 

,1(1/1)/2(1/2) = t*l(Il)U 2 (a ：2 ). (4.4) 

我们将证明，这个关系式组含 

fj ( y ) = u <( x ) = ± e u ^ x \ (4.5) 

其中指数是不超过二次的多项式.这种形式的概率密度只能是正态密度.因此，对 
于具有连续密度的分布，这个定理包含在下列引理中. 

引理飯定 4 个连续函數厶和 巧 以* 教方程 （4.4) 联系着，并且系数 ％ 都不为 
0, 則这些 A 数具有形式 (4.5), 其中指數是次數 < 2 的多項式. 

(当然，假设没有一个函数恒等于 0.) 

证首先注意我们的函数没有一个为 0. 实际上，如果不是这样，那么在 * 1： r 2 平 
面内存在一个区域 X 2, 使得在这区域内 （4.4) 式的两项不为0,而在它的边界上，这 
两项为 0. 但是 （4.4) 式两边，一方面要求边界由平行于坐标轴的线段组成，另一方 
面要求边界由平行于直线 珩 =常数的线段组成.这个矛盾就说明了没有这样的边 
界存在. 

① Izvestia Acad. Nauk SSSR, Vol.l8(1964), pp. 186-200. 定理.令 Xi,... 是相互独立 

W . Yi = EoiXi 和 = SbiXi , 其中没有一个系数为 0. 如果 yi 和 Vj 是麯 立的， 热么 Xi 是 
正态分布的. 
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因此，可以假定我们的函数是严格 正的. 取对数，可把 (4.4) 式改写成 

¥» i ( l / i ) + <^ 2 ( 1 / 2 ) = Wi ( ii ) + W2 ( x 2 ). (4.6) 

对于固定的 / h 和如，定义混合差算子厶为 

x 2 ) = v{xi + hi , x 2 + hz ) - v ( x \. + hi , i2 -/ 13 ) 

— v(xi — h \, X2 + hi ) + w(ii — hi ， X2 — hz ). (4.7) 

因为每一个叫依赖于单个变量巧，由此推出 ^, =0. 同样 

Av > i (» i ) = < pi { yi + h )- ip x (yi + h ) - v > i ( l/i - 1 2 ) + < pi(yi - 1{), (4.8) 

其中为了简略，我们令 

ti = anhi + ai 2 h 2, t 2 = anhi — anhz - (4.9) 

于是我们有 A 仍 + △仍 = 0, 其中朽依赖于单个变 世的. 保持 的 固定，我们看 
出， Ay ( l / i ) 是只依赖于心和 / i 2 的常数.现在我们选择心和 fc 2 , 使 h f 和 
t 2 = 0,其中 < 是任意的且固定的，于是关系式 △仍 =常数，且取形式 

< pi(yi +*) + ¥>1(1/1 -*)- 2< pi ( yi ) = A ( t ). (4.10) 

在奶取最小值的点的的邻域，左边彡0,因此仅当在原点的某个领域内的所有 f 
都有 A ⑷ > 0时，才能存在这样 的点. 但是，在这种情形下， a 不能有最大值.现 
在, 在3个点上为0的连续函数取最大值或最小值，我们 断定： 如果 (4.10) 式的连 
续解在3个不同点上等于0,则它恒等于 0. 

每个二次多项式 q ( Vl ) = av ? + /3 yi +7 都满足形如 (4.10) 式的方程（右边不 
同)，从而这对差 Myi )- g ( vx ) 也是正确的.但是，可以选取使得这个差在3个 
指定点上等丁 • 0,于是仍 (扒） 恒等于 g . 同一论证适用 于灼. 这就证明了关于 A 和 
h 的断言 • 因为变董&和&起相同的作用，所以同一论证适用于密度 Ui . ► 

3.5 矩阵记号，协方差矩阵 

3.1 节所用的记号是繁琐的，并且在更高维中将变得更 繁琐. 利用矩阵记号可 
以达到思维的优美和节约. 

为参考方便起见，我们概述后面将用到的矩阵理论的一些事实和记号.基本规则是，首 
先是行，其次是列.因此，《 x /?矩阵4含有 a 行和卢列，它的元素记为％•第1个下标 
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表示行，第 2 个下标表示列.如果 B 是含有元素 h 的0 x 7 矩阵，则乘积 AS 是含有元 
索 ajl bik + a ia b2 k + ••• + a i0 b 0k 的 a x 1 矩阵.如果 A 的列数与 B 的行数不相等，就不 
能定义乘积.结合律 { AB)C = A ( BC ) 成立，而一般地尹 BA . 转罝阵 A T 是含有元 
索 a : =叫的/? x a 矩阵.显然， ( AB) T = B T A T . 

只含有一行的1 x a 矩阵称为行向量，只含有一列的矩阵称为列向* ■■ ® 行向量 r = 
( n , • •,»•„) 容易印刷，列向量用它的转置 c T = ( Cl , …， Ca ) 表示较好.注意，⑶是^ x a (“乘 
法表 ，型) 矩阵，而 rc 是 | x | 矩萍，即 标量. 在 a = 2的情形， 

cr = ( Cir2 ^ , rc = (nci + rta). 

\ can cm ) 

零向量的所有分量都等于 0. 

行数和列数相同的矩阵称为方萍.对于方阵有一个与它有关的行列式，行列式的 
值用14表示.为此目的，只要知道行列式是可乘的就行了；如果 A 和 B 都是方阵，并且 
C = 则 | C | = | A ||£|. 转置阵 A T 和 A 有相同的行列式. 

所谓单位阵是指在主对角线上各元素均为1,而在其他位置上各元索均为0的方阵.如 
果 J 是含有 r 行和 r 列的方阵， A&rxr 矩阵，显然 ， IA = AI = A. 所谓 A 的逆陣 
是指使 AA- 1 = A~ l A = I 的矩阵 A — 1 [只有方阵才有逆阵.逆阵是唯一的，因为如果 S 
是4的任 • -逆阵，则我们有= J . 由结合律， A - 1 = ( A - U)B = B ). 没有逆阵的方 
阵称为奇异阵.行列式的可乘性蕴含行列式为0的矩阵是奇 异的. 反之亦然，如果/ 0, 
则 A 是非奇异的.换句话说，为使矩阵 A 是奇异的，当且仅当存在一个非0向量 a :, 使得 
xA = 0. 

如果= B 卩 A T = A . 则方阵>1是对称的，与对称的 rxr 矩降 A 有关的二次 

4!定义为 

*A* T = X ： a ifc x,* fc , 
i . fc=i 

其中 X, 是未定的.如果对于所有的非零向 量 * 有 xAx T > 0,是称矩阵4是正定 
的.由上述准则推出，正定矩阵是非奇异的 • 

在中的旋转 为完备起见，我们简要地提及矩阵计算的一个几何上的应用，虽然以后 
没有用到. 

两个行向量 * = (Xl,- ',Xa) 和 V = (»1，…， 》 o ) 的内叙定义为 

*» T = V* T = 53 XiVi ' 

i=i 

* 的长度 i 由 U = ** T 给出.如果 a ： 和 y 是具有单位长度的向量，那么它们之间的夹角 
由 cos (5 = * y T 给出 • 


①这实际上是语言的*用.在具体情形下^可以表示磅，幻可以表示奶牛，于是 (xi,x 2 ) 在严格 
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« x «矩阵 A 导出一个把 * 映为 （ = *A 的 变换； 对于转置阵，我们有 € T = A T x T . 
矩阵 A 是正交的，如果导出变换保持长度和夹角不变，也就是说，如果任意两个行向量和 
它们的像有相同的内积.因此，为使 A 是正交的，当且仅当对于任意一对行向量 x , y , 

xAA T y T = xy T . 

这蘊含 AA T 是一个单位阵/，这是可以看出的，只要对向量 * 和《选取《 - 1个为零的 
分 fi 即可.于是我们得到，为使 A 是正交的，当且仅当 A>4 t = /. 由于 A 和 A t 有相同的 
行列式，因而它等于 +1 和- 1 . 行列式为 1 的正交阵称为旋转阵，且导出变换是-个旋转 
变换. 


今后我们用理解 为行向 量的单个字母来表示 r 维空间 IT 中的点，如 ® = 
-, Xr ), f ( x ) = f ( x u --. ,3V) 等. 不等式理解为各个坐标分董不 等式： 为使 * < 
V , 当且仅当对于* = 1，…, r,:c* < y fc . 对于其他不等式也 类似. 在平面 R 2 上，关 
系式 * < !/可以读作 “* 位于 y 的西 南”. 这个记号的新特点是，两个点不需要两 
个关系式 * < I/或1/ < a: 中的一个成立，也就是说，在高维中不等号只引入偏序. 

我们记 X = ( X u -.., X r ) 为坐标变董的行向貴，并且一般地对随机变贵（主要 
是对正态分布变饿）利用这个记号. 

如果变撖 X u …， X r 有期望 Ep^), 我们就记 E(X) 为其有分量 E ( Xj ) 的行向 
量•向 M X ~ E(X) 的期望为 0. 更一般地，如果 M 是一个矩阵，其元素 M& 是 
—随机变童，我们就以 E(M) 表示元家为 E(M^)( 假定它存在）的矩阵. 

定义如果 E ( X ) = 0,則X的协方 差矩阵 Var(X) 是一个元余为 E(AA) (饭定 
它们都存在）的 r x f 对称矩阵•即， 

Var(X) = E( X t A -). (5.1) 

对于任意X,我们定义 Var(X) 和 Var(X - E( X)) 一样 • 

行向贵的利用需要把由 R 1 •到 R m 的线性变換写成形式 

Y = XA , (5.2) 

即 r 

Vk = Yl a ik x i k = l ,---, m , (5.3) 

i=i 

其中 A 是 r x m 矩阵. 显然，当 E(X) 存在时， E(y) = E ( X ) A . 为求出方差，不 
失一般性，我们假设 E(X) = 0,于是 E(y) = 0,并且 


E( F t K ) = E( A t X t XA ) = A t E ( X t X )A. 


(5.4) 
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因此，我们有一个重要 结果： 


Var ( V ) = J 4 T Var ( y ) A . 

(5.5) 

特别有趣的是，当 m = 1时， 


Y = + • ■ • + QrX r 

(5.6) 

是普通的随机变贵.这里 Var ( y ) 是一个（标憊）二次型 


Var ( y ) = ^2 ^ XjX k ) aj a k . 

(5.7) 


i.fe=i 

如果 Var ( y ) = 0,则线性型 （5.6) 以概率1等于0,并且在这种情形中，超平面 
=0以外的每个区域的概率是 0. 概率分布于是集中在 （r - 1) 维流形上， 
它在 r 维中考虑时是進 化的. 现在我们业已证明：任一非退化 概牟分 布的协方差矩 
阵是正定的.反之，每个这样的矩阵可以作为正态密度的协方差矩阵（见 3.6 节定 
理 4). 

3.6 正态密度与正态分布 

在本节中， Q 表示对称的 r x r 矩阵， 9 ( a :) 表示有关的二次型 

Q { x ) = 53 QjkXjXk = xQx t , (6.1) 

j , k=l 

其中 a : = 是行向量 •在 IT 中用指数上含有二次型的幂定义的密度是 

直线上正态密度的自然对应物，因此我们从下列定义开始. 

定义 r 維密度 称为正态①的，并且中心在原点，如果它有形式 

Ip ( x ) = (6.2) 

其中 * y 是 常数. 中心在 a = ( 01 , 02 ,- ■ • , Ot ) 的正态密度由以® - a ) 给出. 

二维的特殊情形巳在 3.1 节例 （ d ) 和 3.2 节例 （ a ) 中予以讨论 • 

我们取以 (6.2) 为概率密度的 IT 作为样本空间，并以= ( X ir ”， X r ) 表示 
由坐标变量构成的行 向董. 它的协方差矩阵以 M 来 表示： 

M = Var ( X ) = E ( X T X ). (6.3) 

①•退化的■■正态分布将在本节末弓 I 入. 
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我们的问题是研究矩阵 Q 和 M 的本质和它们之间的联系. 

首先，我们看到 Q 的对角线元素都不能等于 0. 实际上，如果我们有= 0, 
那么对于町，…, avq 的固定值，密度 (6.2) 取的形式，它关于 av 的积 
分发散.现在我们引入由下式定义的变换1/ = *乂 ： 


= *1 ， •. • ， Vr-l = X r - 1 , (6.4) 

Vt = q \ r X \ + ••• + q T rX r . 

由观察可以看出， g (®) - Vr / Qrr 是 A , • _ •，: Eh (不含 ： T r ) 的二次型.因此 

q (. x ) = ^- y ^. + q ( y ), (6.5) 

Qtt 

其中欹 l /) 是 Wi ，• • -, Vr - i 的二 次型. 这表明向撤 Y = XA 有正态密度，此密度被分 
解为 y r 和（&，•••, Ky ) 的两个正态密度.所作出的第1个结论是简单而重 要的： 
定理1 正态密度的所有边缘密度还是正态的. 

难以料到的是 •- 

定理2 存在一个行列式为正的矩阵 C, 使得 Z = XC 是一个行向量，其分量& 
是相互独 A 的王态变量. 

矩阵 C 不是唯 一的. 事实上，这个定理可以强化为， C 可以选为旋 转矩阵 (见 
习题 19). 

证我们用归纳法证明.当 r = 2时，断言巳包含在分解式 （6.5) 中.如果定理在 
r - l 维时是正确的，那么变童 VI ,…，是独立正态变量&,…， Zry 的线性组 
合，而 K 本身是正态的且与其余变撤独立.因为 X = YA - 1 , 所以还推出， Jfj 是 
A ，… ，厶- i 和的线性组合 • >1的行列式等于且 (6.5) 蕴含它是正的.变换 
x -* z 的行列式是 A 的行列式与变换 F — Z 的行列式的乘积，因而它是正的. 

► 

定理 3 矩阵 Q 和 M 互为逆阵，且 

7 2 = (2 n ) r | Af |, (6.6) 

其中 | M | = IQI — 1 是 M 的行列式 • 

证利用上一定理的记号，令 

D = E ( Z t Z ) = C t MC . (6.7) 

这是一个对角线上各元素为 E ( Zj ) = a ), 而对角线外各元素为0的矩阵 • Z 的密 
度是这些正态密度 nixar 1 )^ 1 的乘积，从而它由对角线元素为#的矩阵 I ?— 1 导 
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出. 于是 Z 的密度可由尤的密度 (6.2) 通过代换 * = zC x 并乘以行列式 1 C - 1 ! 
得出.因此， 

zD ^ z 1 = xQx r (6.8) 

和 

{2 nY \ D \=^\ C \ 2 . (6.9) 

由 (6.8) 可以看出， 

Q = CD 1 ^. (6.10) 

由 (6.7) 看来，这蕴含 Q = M -1 . 由 (6.7) 还推出 | D | = | Af | • \ C \ 2 , 因此 (6.9) 等价 
于 (6.6). 

特别，此定理蕴含 M 的分解对应于 Q 的类似分解，因此我们有 
系 如果 (, X U X 2 ) 是正态分布的，則为使&和 X 2 是独立的，当且仅当 Cov(X X) 
X 2 ) = 0, 即当且仅 当不和 X 2 是不相关的 • 

更一般地，如果 { X u ---, X r ) 有正态密度，则为使 （ Xi , …, X „) 和 （ X „ +1 ，…， 
X r ) 是独立的，当且仅当对于 ACovphA ) = 0. 

注意这个系依赖于 ( X U X 2 ) 的联合密度是正 态的； 如果 只知道和 X 2 的边 
缘密度是正态的，則这个系就不能 应用. 在 后一情 形下， ( X U X 2 ) 的密度不一定是 
正态的，供实上并不一定存在.这一事实常被误解（见习题2和习题 3). 

定理4 为使矩阵 M 是正态密度的协方差矩阵，当且仅当它是正定的. 

因为密度由矩阵 <3 = AT " 1 导出，所以定理的一个等价叙 述是： 为 使矩阵 Q 
导出正态密度 （6.2), 当 且仅当它是正定的. 

证我们已在3. 5 节末看到，每个密度的协方差矩阵是正定的.当 r = 1时逆命题 
是成 立的. 我们用归纳法予以 证明. 假设 Q 是正定的，对于別= ... = x r _! = 0, 
我们得到= q rr x ^, 从而9„>0 - 在此假设下，我们看出 g 可以化为 (6.5) 的形 
式. 选出使 办 = 0的 av , 我们看出 Q 的正定性蓮含着对于 ari ,---, x P _ i 的一切选 
择，都有啦）> 0. 因此，根据归纳法假设，$对应于 r -1 维正态密度.显然由 (6.5) 
式，9对应于 r 维正态密度，这就完成了证明. ► 

根据 (6.5) 式的 解释， 我们用条件密度推出这个一般理论，此条 件密度 导致在 
3.2 节例⑷中对于二维情形已阐述过的回归理论的一般描述. 

为简略计，令办= - qkr / qrr , 因此 

Vt = qrr (. X r - “lXi - Or _ iI r _ i ). (6.11) 

为了给出系数办的一种概率解释，我们记得，1；是与 X U ---, X r - l 独立的. 
换句话说，叫是使 

T = X r — a\Xi - Or - iXr^i (6.12) 
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与 d ，…， X r ) 独立的数.这一性质唯一地表示了 系数叫 的特性. 

为了得到在给定 A = 下的条件密度，我们应当将 

(不，…, X r ) 的密度除以的边缘密度.由 （6.5) 式，我们得到含有指 
数 -^rhrr 的指数密度.由此推出，在给定不= H ，• • , X r - l = Xr-i ~f X r 的条 
件密度，是一个具有期望 a 1 a : 1 + -.- + a r _ 1 x r _ 1 与方差 l / q rr 的正态密度.因此， 
E ( m ，... , X r - j ) = aiXi + ••• + Or - iXr - i . (6.13) 

于是我们证明了已在 (2.6) 中体现了的二维回归理论的下列推广. 

定理5 如果 ( Xi ,---, X r ) 有正态密度，那么在给定 X U -"U X r 的条 
件密度也是正 态的. 而且，如果： T 与 ( X u …， X r - i ) 独立，則条 件期望 （6.13) 是 
X ir --, X r -i 唯一的线性函数.条件方差等于 Var ( r ) = q ~\ 

例样本均值与样本方差，在统计学中，随机变最 

^ = i ( Xi +-+ X r ), a 2 = i ^( X *- X ) 2 (6.14) 

分别称为 X = ( X u …， X r ) 的样本均值与样本方差.一个奇妙的亊实是，如果 
x u …， X r 是满足 E (不 ■) = 0, E ( X ^) = a 2 的独立正态变量■，則随机变量戈和护是 
独立的 .® 

此证明说明上述结果的适用性.我们令 n = X k - X ,( k ^ r - l ), 而 K r =允 
从 A ■到 V = ( Ki ,• •,!；) 的变换是线性的和非奇异的， y 有正态密度.因为对于 
*< r - i , E ( nn ) = o , 所以 n 与⑺， …，心―）独立.但是， 

rd 2 = n 2 +-- + K-i + m + …+ Vr-i) 3 (6.15) 

只依赖于 yi ,- -, yr - l , 因此沒 2 确实与 Vr = X 独立. 

一般的正态分布 

由引理推出，如果 X =( 尤 i ，…,夂)有正态密度，那么每个非零线性组合 Vi = 
〜不 + ■•• + 〜& 也有正态密度，这对于毎个对偶 ( Y u Y 2 ) 同样是正确的，只要没 
有线性关系式 cxn + car ^ o 成立. 在这种特殊情形下， ( n , y 2 ) 的概率分布集中 
在方程 c lWl + c 2 的= 0确定的直 线上. 因此，如果把它看作是二维分布，那么它是 
奇异的.在很多场合，对于集中在低维流形（例如个别的轴）上的退化分布，仍然保 
持正态分布这个术语是合乎需 要的. 最简单的一般定义 如下 ： y = ( Y lt -■■,¥„) 的分 
布是正态的，如果存在这样一个具有正态 r 维密度的向量^-(不,…，；^),使得 
Y = a + XA , 其中4是 r x p (常数）矩阵 ， a = ( ai , ••.,%)•如果 p > r , 那么在 p 

①吉里 （R c . Geary ) 和卢卡克斯 ( E . Lutecs ) 指出，这个事实表示圯中正态分布的特性. 
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维中， Y 的分布是退 化的； 对于/为使它是非退化的，当且仅当 p 使所定义 
的 Ffc 是线性独立的. 


*3.7 平稳正态过程 

本节的目的，部分地是提供正态分布的例子，部分地是导出在离散随机过程和 
时间序列理论中有重要应用的一些关 系式. 它们具有分析的特性，并且容易从较 
高深的随机分析中分出.事实上，我们将只讨论有限维正态密度，或者等价地只讨 
论它们的协方差 矩阵. 引用随机变量对概率直观是很重要的，并可作为应用的准 
备，但是在目前我们只讨论它们的联合分布；随机变童本身仅作为由指出相应的集 
( X ai ,---, x ak ) 来描述所有的边缘密度的方便 方法. 同样，提到无穷序列{ X *}只 
是蕴含， ( Xx ,---, X n ) 中的项数可以取任意大. 

事实上，我们将考虑双边无穷序列 - 这种序列表明，对应于 
每个有穷集 ( X ni ,---, X nr ), 我们给出一个具有显然的相容性法则的正态密度•序 
列是平穗的，如果这些分布关于时间推移是不变的，即如果对于固定的 〜,•••,〜， 
形如 ( X ni + r ，•- -, X „ r + J 的所有 r 元组，具有与 t ； 独立的相同分布.对于 r = 1 ,这 
蕴含期望与方差是常数，因此不失一般性可设 E ( X n ) = 0 . 联合分布完全由协方差 
p ik = E ( XjX k ) 确定，平稳性 要求仏 只依赖于差 \ k - j \, 从而我们令 Pij +n = r n , 
因此 

r „ = E ( X fc X fc+n ) = E { X k .„ X k ), (7.1) 

于是 r „= r _„. 实际上，我们只讨论可作为平稳过程的协方差的数列 r „. 

在本 节中， { Z „} 表示由下式正规化的 相互社 立正态变量的 双边无穷序列 ■ 

E ( Z „)=0, E ( Z *) = 1. (7.2) 

通过给定的序列 { Z n } 来构造平稳序列的3种方法将予叙述.它们在时间序列分析 
中被普遍使用，并可作为平常运算的练习. 

例 （ a ) 广义移动平均过租.对于任意常数 60,1 • 

X n = boZ „ 4- b \ Z„-i + • ■ • + bsZ n - N - (7.3) 

在相等系数知= 1/( JV +1) 的特殊情形，变董是时间序列分析中用来“磨光”数 
据的那种类型的算术平均值(即消除局部不规则性).在一般情形下 ， （7.3) 式表示把 
平稳序列 { Z n } 变为一个新平稳序列 { X n } 的线性箅子.这种算子的流行术语是“滤 

* 后面没有用到.特别地 ， 3.8 节可以独立地阅读（参见 19.8 节). 
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波器' 序列 { X n } 的协方差为 

rk = r- k — E ( X n . y n + fc ) = y ^, b v b v (k ^ 0), (7.4) 

这级数只含有穷多项. 

因为 2|6„6„+*| ^ tii + h 所以表达式（ 7 . 4 )对于使 S ^< oo 的无穷序列也 
是有意义的 •容易 看出，协方差矩阵序列 的极限 仍然是协方差矩阵.令 TV — oo , 我 
们断言 ，对于 E 圮 <oo 的任一序列 6o,6i … ,(7.4) 式中的数可以作为平穗过程 
{ X n } 的协方差. 在形式上，对于新过程我们得到 

X n = f ^ b k Z n - k . (7.5) 

fc =0 

不难证明，每个具有协方差 (7.4) 的平稳过程都有这种形式，但是关系式 (7.5) 包含 
无穷多个坐标，我们现在还不能予以证明.（见 19.8 节 .） 

例 （ b ) 自回归过程.自 从时间序列分析开始以来， 巳 经提出了各种理论模型来解 
释诸如经济的时间序列、太阳黑子和被观测（或设想）的周期性这样一类经验现象. 
最普通的模型 假设， 过程的变婧和我们的 （7.2) 的独立正态变童序列通过 
下列形式的 自回归方租相 联系. 

OoX n + OiX n _j + ■ • • + aNX n -N = Z „. (7.6) 

这个槙型根据的是如下的经验假设，变贵在时刻 n 的值（价格、供应物或 
强度）依赖于它过去的发展情况并加上一个“随机扰动” 这扰动与过去无关.通 

常就是这样，线性相关性的假设用来简化理论分析(或者使其成为可能).更一般的 
模型可由令 — 00或者令是另一平稳过程的变 M 而得出 • 

如果 oo #0, 则我们可以任意的方式来选取（為 ，…, 然后递推地计箅 
X N ， X N +1 , …，和 X - U X _ 2 ，…. 在这种意义上， （7.6) 式决定了一个过程，但我们 
问，是否存在一 个平旗 解呢？ 

为了回答这个问题，我们把 (7.6) 式改写成不包含最接近于的前面那些项 
的形式.考虑 (7.6) 式并把 n 依次换为„ - 1, „ - 2 ,…, n - w . 将这些方程分别乘以 
H .， b v ， 加到 (7.6) 式上. 为使变董，…，不不出现在新方程中，当且 
仅当~满足 

Qo^i + ai 6 o = 0,…， (7.7) 

oo&v + ai^v-i + • • • + dvbo = 0, 

并且 bo = 1. 于是最后的恒等式具有形式 

aoXn — boZ n + b \ Z n ^\ + • • • + b v Z n — v 4 - Y ni „, (7.8) 
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其中是 X — u …， X n - N _ v 的线性组合（对系数不感兴趣).在 (7.8) 式中， 
我们巳经将变董表示为时刻 n , „ - 1， •••,„- v 上的偶然作用与变量叠加 
的结果，变量表示在时刻 n - v 前时间的 影响. 当 t > — oo 时，这个时间变成 
为“无穷远的过去”，并在大多数情况下它的影响消失了.我们将（至少是暂时）假 
设情况就是这样取极限，也就是说，我们在寻找满足下列极限关系式的过程> 

00-^n = ^2 ^kZn-k- (7.9) 

fc =0 

(粗略地说，我们假设剩余的变童趋于0,其他可能的极限将在例 （ d ) 中指出). 

形如 (7.9) 式的过程是例 （ a ) 的研究 对象. 我们看到，当 E 枝 < oo 时，平稳解 
存在（如果级数发散，那么连协方差表达式也无意义). 为了对 b k 解方程 （7.7), 我 
们利用形式上的母函数 


= ^2a k 8 k ,B(s) = ^2b k s k . 


(7_10) 


为使方程 (7.7) 成立，当且仅当 A ( s ) B ( 8 ) = aobo . A 是一个多项式， S 是一个有理 
多项式.因此，我们可以利用在第1卷 11.4 节中研究过的部分分式理论.如果多项 
式外) 有不同的根 «!,•••, 那么我们得到 


+ - + ( 7 . u ) 


因而 


«>n =>tl8r n_1 + ••• + ^ArV 


(7.12) 


显然，< oo 当且仅当所有的根满足 hi > 1, 容易验证这在有重根时也是正 
确的，因此，我们证明了，当 多项式 i 4( s ) 的所有根位于单位圓外面时，自因归模 
型 (7.6) 的平德解存在， 我们这个过程的协方差由 (7.4) 式给出，并且在这个过程 
中，“无穷远的过去”不起作用. 

自回归方程 （7.6) 的解 { X n } 是唯 一的. 实际上，两个解的差将满足齐次方程 
(7.13). 我们现在将指出，条件 |勺| > 1排除了这方程有概率论意义的解的存在性. 
例 （ c ) 遑化 过程. 我们转向满足下列随机差分方程的平稳序列 { Y n }, 


oo^n + oi ^ n-i + • ■ • + anY n -N = 0. (7.13) 

它们表示一个取决于 (7.6) 式的自回归过程的有趣的过程_典型的例子是 


Y n = X(Zi costuj + Z-i sinnh ；) 


(7.14) 
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和 

Y n = atZi + (- l ) n a 2 Z _ x , (7.15) 

其中诸系数和 w 都是常数， A 和是由 (7.2) 式规则化了的独立正态变童.这 
些过程满足 （7.13), 第一式有 ao = as = 1和 ai = —2 cosai , 第二式有 ao = —ag = 1 
和勿= 0. 从整个过程完全由两个 观测值 (例如 Vib - i 和 Vfc ) 所决定的意义上看，它 
们是退化的.这两个观测值在我们所能想像的遥远的过去就被取定.在这个意义上， 
过程完全由它的“无穷远的过去”所决定.同样的说明适用于满足形如 (7.13) 的差 
分方程的任一过程，因此这些过程形成例 （ b ) 的对应过程，其中无穷远的过去完全 
不起作用. ► 

这些例子表明，把重点放在随机差分方程 (7.13) 上的普遍重要性.在讨论它的 
理论之前，我们注意，任一满足 (7.13) 的过程 { y „} 也满足各种高阶的差分方程， 
例如 

OoYn + (<*1 — ao)l^-l +••• + (on — aN-i)Y n -N — ONY n -N-l- 

为了使问题有意义，我们应当假定 (7.13) 表示 {¥„} 所满足的最低阶差分方程•这 
等于说 iV 元组 ( Y u -■■,¥„) 为非退化的，具有 AT 维正态密度.它籩含 ao / 0和 
aw ^ 0. 

现在来说明差分方程 (7.13) 的平稳解理论与下列“特征方程”有密切的联系 ■ 

(7.16) 

对于左边多项式的每个二次因子，有一个相应的二阶随机差分方程，它们都是具有 
形式（7.14> 或 (7.15) 的过程.因此，相应丁-特征多项式的因子分解，我们将把 (7.13) 
式的一般解表示为形如 （7.14) 和 (7.15) 的分 S 之和. 

如前所述，我们假设中心为 E ( y „) = 0. 整个理论依赖于下 面的： 

引理1 为使具有 E ( y n r n+fc ) = Y k 的平穗序列满足随机差分方程 (7.13), 当且仅 
当 

ao r n + oir n -i + • • • + ai >/ r n -ff = 0. (7.17) 

证将 (7.13) 乘以 F 0 并取期望得到 （7.17), 将 (7.13) 的左边平方并取期望得到 
!>) ( E ，因此 (7.17) 菹含着 (7.13) 的左边方差为 0. 这就证明了引理. 


我们着手推导 r n 的典型形式.当然，它是实的，但是它包含特征方程 （7.16) 的 
根，因此我们必须暂时利用复数. 

引理2 如果 {y n } 满足 (7.13), 但不满足低阶差分 方租， 那么特征方程 （7.16) 具 
有 iV 个单位模的不同根在这种蜻形下， 

r„ = cie? + --- + c w G. (7.18) 
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其中 c j > 0 ,j = l, --,N. 

证首先假设特征方程 （7.16) 有 AT 个不同的根&，•••，&.我们借助于在第1卷 
中为了类似的目的已用过的特解方法来解 （7.17) 式.观察表明， （7.18) 表示一个依 
赖于 iV 个自由参数 Cl , …， cw 的形 式解. 因为 r „ 由 AT 个值 ri ，…，完全决定， 
所以为了证明 (7.17) 的每个解都具有 (7.18) 的形式，只要 证明勺 可以这样选择， 
即使得关系式 (7.18) 可得出 n ,---, r N 的指定值就行了.这意味着勺应当满足 iV 
个线性方程，方程的矩阵 a 具有元索％ = eic ?. *： =1，…，汉)，义的行列式不等于 
0,® 因此所要求的解存在. 

于是我们证实了（在不同根的情形)确实具有 (7.18) 的形式.其次我们将说 
明具有单位模的根确实可以在其中出现.我们知道 aw # 0,因此0不是特征方程的 
根. 我们注意到，协 方差〜 是以 K 的共同的方差 n > 为界.但是，如果0不具有 
单位模，那么或者当 n — oo 时，或者当 n - -00 时， - oo . 由此推出，对于 
每个么 1心1 = 1,否则勺= 0. 

现在假设&和&是一对共轭根 ， Cl # 0,则心具有单位模，从而6 = f 1 .因 
此，对称关系式 r n = 要求 c 2 = c , 而且辽+玆是实的，因此 Q 应当是实的. 
于是复根以一对有实系数的共轭根形式在 (7.18) 中出现，并且如果某些系数等 
于0,那么〜将满足阶数小于 AT 的差分 方程. 因此，所有的根具有单位模，所有的 
勺是实的，并且 9/0. 

为了说明勺实际上是正的，我们引入 (Y U ---,Y N ) 的协方差矩阵 Jl . 它的元索 
由给出，由 (7.18) 容易验证 


R = ACA t , (7.19) 

其中 C 是含有元素 Cj 的对角阵，4是上面引入的矩阵， A 是它的共轭阵（即它是 
由4把&换为而得到的).因为 R 是实正定的，所以对于任意的复 iv 维非零 


行向量 * = « + 1>, 




xRx t = vRu t + vRv t > 0. 

(7.20) 

令1/ = 它就化为 




vCy T = ^Cjltfjl 2 > 0. 

(7-21) 




①这个行列式通常称为范*蒙德 (Vandermonde) 行列式.为了证明它不等于0, * 把€换为自由变 
量 rr. 于是观察表明，行列式具有 xP { x ) 的形式.这里 P 是 W - 1次多项式.当X = 

时， P(i) = 0. 因为对于I的这些值，行列式的两列变成相同的.因此，对于I的任一其他值，特 
别是对于 * = «i, 行列式可以不等于 0. 
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因为4的行列式不等于0,所以这个不等式对任意的 y 都成立，于是如所断言的 
那样 ， cj > 0. 

为了完成证明，我们将证明特征方程不能有多重根.假设6 =&,但是其他的 
根是不同的.我们又得到形如 (7.18) 的表达式（除了 句玎 项换为项以外) . r n 
的有界性又要求 Q = 0. 在一个二重根的情形，我们由此得出含少于 iV 个非零项 
的形如 (7.8) 的表达式.我们看出，这是不可 能的. 同样的论证更一般地说明了不可 
能有多重根. ► 

我们现在来叙述为奇数情形的最后结果.对偶数 JV 所需要的修改是明显 
的. 

定理假设平穗序列 { Yn } 满足 N = 2 v + 1 的差分方程 (7.13), 但不满足较低阶的 
差分 方程. 特征方程 （7.16) 有 w 对复根心=«»吣 土 isinw〆％ 是实教）和一个实根 
w 0 = ±l. 序列 { Y n } 具有形式 

Y n = XoZoi^o + coena>j- + Z-j sin nujj ], (7.22) 

j=i 

其中 Zj 是期望为 0 且方差为 1 的相互》立的正态变量，而\是常数.对于这个 
序列， 

r„ = cos nujj . (7.23) 

i=i 

反之，选取任意的实敫 A„ / 0,wo = ±1，令是使 0< Wj<Ji 的不同 
实數，则 (7.22) 确定了一个具有协方差 (7.23) 的平穗过程，它满足一个 2i; + 1阶 
差分方程，而不满足较低阶差分方程. 

证令丨和 吣 是数，&是满足定理条件的正态变 JS •以 (7.22) 定义变董 y „. 平 
凡的计算表明， { Y n } 的协方差 r „ 由 (7.23) 给出.存在一个具有定理中所说的根心 
的形如 (7.16) 的实代数方程，于是 tv 满足差分方程 (7.17). 根据引理1,这苗含 
满足随机差分方程 (7.13). 根据构造，这是一个 y „ 所满足的最低阶方程. 

反之，令 { Y n } 表示给出的差分方程 (7.13) 的解. {y n } 的协方差 》•„ 决定了出 
现在 (7.22) 中的数\和叫.对于 n = 0,1，…， 2v， 把这些方程看作是一个从任意 
的正态变量的 n 元组 （ Zf . ，叫到 { Y 0 ,---, Y n ) 的线性 变换. 这个变换是非奇 
异的，因此两个况元组的协方差矩阵相互唯一 确定. 我们业巳证明，如果&的协 
方差矩阵化为单位阵，则 V * 将有指定的协方差 r „. 因此，反之亦然，存在正态变 
请4满足定理的条件，并使 (7.22) 对 n = 0,… ,7 V 成立.但是，这些方程的两边 
表示随机差分方程 (7.13) 的解，并且因为它们对于 O ^ n ^ N 是一致的，所以它 
们必须是相等的. ► 
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3.8 马尔可夫正态密度 


我们再来讨论产生于马尔可夫过程中的一类特殊正态密度.不失一般性，我们 
只考虑中心在原点的密度，则 E(X k ) = 0_ 我们利用通常的缩写记号 

E ( X 2) =兄 E(XiX k ) = ai a kPjt ,. (8.1) 

Pj k 是相关系数，且 Pfcfc = 1. 

定义 的 r 维正态密度是马尔可夫密度，如果对于 fc < r, 在给定 

Xu -.' Xk-if X k 的条件密度，与在给定下^的条件密度相等. 

粗略地讲，如果我们知道(“现在”），那么“过去”义 1 ,...,义*_ 2 的附加知 
识并不提供有关“将来”的任何信息，即不提供有关&的任何信息，这里 j > fc. 

通常在类似的情形下，我们把马尔可夫这一术语可交换地应用于 (X U --,X r ) 
及其密度. 

定理1为使 ( X !,.--, X r ) 是马尔可夫序列，下列两个条件中的每一个都是充分必 
要条件 | 


(i) 对于 * < r, 



EpCfclA,. 

••,X fc _ 1 ) = E(^ fc |X *_ 1 )； 

(8-2) 

(li) 对于 j < « ^ fc < r, 

Pjk = Pi. Pv„, 

(8-3) 

即为使 （8.3) 成立，只要 



Pih = 

Pj,k-iPk-i,kij < k). 

(8-4) 


证密度的恒等蕴含期望的相等，所以 (8.2) 显然是必要的.另一方面，如果 (8.2) 
成立，那么 3.6 节定理5说明，在给定 X u … U Xk 的条件密度只依赖 
于 X k . lt 而不依赖于前面的变量.因为在给定 Xk-iT X k 的条件密度由对变 M 
Xu …、 Xk -2 进行积分得出的，所以两个条件密度是恒 等的. 于是 （8.2) 式是充分 
必要条件. 

再借助于 3.6 节定理5,显然变 M 

T = X fc -E(X fc |X k _ 1 ) (8.5) 

和变量 

T = Xk — ■— k pk-i,kXk-i ( 8 . 6 ) 
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是恒等的，因为这只是一个与 Xu 不相关的形如 X k - cX *-! 的变量.因而根据 
同一定理，为使 (8.2) 式成立，当且仅当 r 也与& ，…， &_ 2 不相关，即当且仅当 
(8.4) 式 成立. 因此 (8.4) 式是充分必要 条件. 其实 (8.4) 式是 (8.3) 式的特殊情形， 
因此 (8.3) 式的条件是充分的.它也是必要的，因为 (8.4) 式的重复应用表明，对于 
j <v < k ^ r , 

BK = Pi±± = BLbzl = ^L = Pjv , (8.7) 

Pv k Pv ' k -1 Pj , k-2 Pw 

因而 (8.4) 银含 (8.3). 

系如果 （ Xi ， …， Jf r ) 是马尔可夫序列，那么满足 o：i < o ：2 < …< < r 的每个 

子集 （ X ai ，…， X ar } 也是马尔可夫序列. 

这是显然的.因为 (8.3) 式可自动地推广到一切子集. 

例 （ a ) 独立 增曼.满足 E ( X k ) = 0的正态随机变 M 的（有穷或无穷)序列 { Xfc } 称 
为具有独立增董的过程，如果对于 j < fc , 增董 A 是与 （ A , 独立的. 
特别地，这组含 

E ⑷ ( X * - Xj )) = 0 
或 

Piu = 3< (8.8) 

把这式与 (8.3) 式比较，我们看出，具有独立增量的正态过程自动地晕马尔可夫过 
程. 它的构造比较 简单： X * 是下列 fc 个相互独立的正 态变憊的和： 

Xi ， X 2 - Xu ,Xk — Xk -\- 

例 （ b ) 自回归 模型. 考虑具有 E ( X fc ) = 0的正态马尔可夫序列 Xi ， X 2 , …•存在 
唯一的一个常数 a fc , 使得 A - a / tX / M 与 X k - i 独立，从而与 X u - , X k - i 独立. 
令 

X 2 k = Wax { X k - a k X k . l ), 

递推地有 

^ fi = XiZi , 


Xk = a / cX / c-i + AfcZfc , fc = 2,3, • • •. (8.9) 

容易看出，这样定义的 变量& 是独立的，并且 

E ( Z k ) = 0, E (珣 )=1 • (8.10) 
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反之亦然，如果 A 是正态的且满足（8.10)，则 (8.9) 确定了序列 { X n }, (8.9) 的实 
际构造表明 { X n } 是马尔可夫 序列. 作为练习，我们用计算来验证它•将 (8.9) 乘以 
Xj 并取期望.当 A 与 A , • • -, X k . x 独立时，对于 j < k 我们得到 


<^k Pjk 
° k-l Pj , k -1 


(8.U) 


于是 (8.4) 是此式的简单 推论. 我们知道，它苗含；^的马尔可夫特性.因此，（&,•••， 
^ r ) 是马尔可夫序列，当且仅当形如 (8.9) 的关系式对于满足 (8.10) 的正态变童 
4成立[这是 3.7 节例 （ b ) 的特殊情 形]. ► 

至此我们只考虑了有穷序列 ( X ir -, X r ), 但是数 r 不起作用，我们同样可 
以谈到无穷序列 { X n }. 这并不包含无穷序列空间或任何新的理论，而只是指出 
的分布对一切 r 都是确 定的. 类似地，当任一有穷序列= 
X ( h ),---, X r = X ( tr ) 是马尔可夫序列时我们谈到马尔可夫族 { A •⑷ }. 这种描述 
依赖于函数 

E ( X 2 (*)) = a \ t ), E ( X ( a ) A -( t )) = ( x ( 8 ) a ( t ) p (8 t t ). (8.12) 

由 （8.3), 显然，一个族是马尔可夫族，当且仅当对于 《< t < r . 


P («, t ) p ( t , r ) = p ( a , r ). (8.13) 

不管怎么说，我们实际上只讨论具有满足 (8.13) 的协方差的有穷维正态分布族 • 

和 3.7 节开始比较详细阐明的一样，序列 { X n } 是平稳的，如果对于每个固定 
的《元组（勿，…， a „)，( X ai + „ ，…， X an + V ) 的分布与 W 无关.这样的序列的有穷截 
U 可以扩展到两边，从而自然的仅考虑双边无穷序列 {■■■, X . 2 , X - 1 , X 0 , X l , -}. 
这些记号很明显地可搬用到族■⑷}上. 

对于平稳序列方差4与 n 无关. 在马尔可夫的情形， （8.3) 式蘊含仏= 
因此，对于平穗马尔可夫序列， 


E ( XjX k ) = <r 2 p |fc - il , (8.14) 

其中 t 2 与 p 都是常量， | p | < 1. 反之，具有满足 (8.14) 的正态分布的序列是马尔 
可夫平稳序列. 

在平稳族{义⑴}的情形，相关系数 p(s,t) 只依赖于差卜札且 (8.13) 取下面 
的形式： 

p(t)p(r) =p(t + t), 对于 t,T >0. 

显然， P ( T ) = 0蕴含对于所有的 f > t ■有 p ⑷= 0,又有 

KH =o . 



86 第 3 幸高维密度、正态密度与正态过程 


从而 P 可以不为0,除非对于所有的 f > 0有 p ( t ) = 0. 因此，根据第1卷 17.6 
节中反复利用的结果， p ( t )= e ~ xt . 因而对于平穗马尔可夫族. 


E ( X ( s ) X(s + 0) = trVS ^ O . (8.15) 

除非对所有的 s / H ( s ) 与 X ( t ) 是不相关的. 

例 （ c ) 平稳序列可以按照上例的方式来构造.由 （8.11) 式，我们应当有 


Xk = pXk-l + < Ty/l — p ^ Zk ， (8.16) 

对于每一个 fc , 可以把 x * 表示为，…， Z fc _„ 和 X k . v 的线性组合.形式上 
的取极限可以得到用独立正态变董4的双边无穷序列表示 { X k } 的表达式 


Xk = cry/i - 


(8.17) 


其中&由 (8.10) 所正规化•由于 | p | < 1,所以级数的收敛性似乎可能的，但是像 
这样的公式包含无穷序列空间【见关于 (7.5) 的说明， (8.17) 是它的特殊情形 1. 

讨论定理1的关系式对于用密度作马尔可夫序列的直接描述可能是有益的•以 
9i 表示丨的密度， 9idx , y ) 表示在给定 兄 = I 下&的条件密度在 2 /处的值(在 
随机过程中，仍 k 称为由 A 到&的转移密 度). 对于正态马尔可夫序列，讲是期望 
为0、方差为 <7?的正态密度.至 T 转移概率，在 3.2 节例 （ a ) 中已经指出 


9 ik ( x , y ) 


<^kV 1 -Pi k n 


(y - ^r 1 Pik(Tkx\ 

V ) 


(8.18) 


其中 n 表示标准正态密度.但是，我们将不利用这个结果，而利用独立的方法来分 
析的性质.我们照例把下标解释为时间参数. 

( Xi , Xj ) 的联合密度由 gi { x ) gij ( x , y ) 给出. { Xi , X jt X k ) 的联合密度，是 
和在给定& 与 Xi T X k 的条件密度的乘积.但是由于马尔可夫 
特性，如果 i c j < *:, 那么指标 i 可以去掸，并且的密度由下式给出， 


9i ( x ) gij ( x , y ) g jk ( y , z ). 


(8.19) 


在马尔可夫的情形，每个 n 元组 ( X ai ，. 的密度由形如 (8.19) 的乘积给出， 
但是密度鉍不能任意选择.实际上， (8.19) 关于 y 的积分得到 { XM 的边缘密 
度，因此我们有相容性条件：对于所有的 i < j < k , 



9ij ( x , y ) g jk ( y , z ) dy . 


( 8 . 20 ) 
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这是马尔可夫过程的査普曼-科尔莫戈罗夫 （ Clapman - Kolmogorov ) 恒等式的特殊 
情形•① 

粗略地说，它表示由时刻 i 上的 a ; 到时刻 ifc 上的2的转移是通过任意的中间 
位置 V 而发生的，由 y 到 z 的转移与过去无关.显然，对于任一满足査普曼-科尔 
莫戈罗夫 恒等式的转移概率系 统灿， 乘法格式 (8.19) 得出 ( X 1( X 2 ,-.., X r ) 的相容 
密度系统，并且序列是马尔可夫序列，因而我们具有定理1的下列分析对应定理. 
定理 2 { 5ifc } 可以作为正态马尔可夫过程的转移密度，当且仅当它鴻 足查普受 - 
科尔莫戈罗夫恆等式，并且对千 每个® 定的: r 来说， g ik { x , y ) 表示在 y 处的正态密 
度 • 

两个定理都包含必要和充分的条件，因而它们在某种意义上是等价的.但是， 
它们具有不同的本质.其次，在实际上并不局限于正态 过程； 应用于族它 
可以得到转移概率的微分和积分方程.因此，用这种方法可以引入一类新的马尔可 
夫 过程. 另一方面，由定理2我们不能断定是 (8.18) 式的必要条件，结果菹含 
在更特殊的定理1中. 

为了参考和以后的比较，我们在这里列举两个最重要的马尔可夫族 ( X ( t )}. 

例 （ d ) 布朗 ( Brown ) 运动或维纳-巴舍利耶过租.它由下列条件 定义： X (0) = 0, 
对于< > s , 变童 X ⑴-尤 (《) 与 X ( a ) 独立， X (8) 具有仅依赖于 f - s 的方差.换 
句话说，这个过程有独立增贵[例 （ a ) l 和平稳转移概率（但它不是平稳过程，因为 
X ⑼= 0). 显然， E ( X 2 ( t )) = oH , 并且对于《 < *， E ( X ⑷邱 )) = a 2 a ； 对于 r > t , 
由到 ( r , y ) 的转移密度是正态的，具有期望 z 与方差 /( T - t ). 它们只依赖 
于 （V - *)/(T-t), 并且査普曼-科尔奥戈罗夫恒等式化为卷积. 

例 （ e ) Urnstein - Uhlenbeck 过租.这个过程指的是具有期望0的最一般的正态平 
稳马尔可夫过程.它的协方差由 (8.15) 给出.换句话说.对于 t > 由 （*, a :) 到 ( r , y ) 
的转移密度是正态的，具有期望与方差 a 2 ( l - e - 3 M -0). 当 T — oo 时, 
期望趋于0,方差 趋于只 乌任斯坦 ( Urnstein ) 和乌伦贝克 ( Uhlenbeck ) 从完全不 
同的观点考虑这个 过程. 它与扩散的联系将在 10.4 节中讨论. 


3.9 习 题 

1.令 n 是以 顶点为 （0, 0), (1, 1), (0,1/2), (1/2, 1) 的四边形和 m 点为 (1/2, 0), (1, 0), (1, 
1/2) 的三角形为界限的（面积为1/2的）平面区域（单位正方形是0与关于对角线对 
称于 n 的区域的并集).令 （ X , y ) 在 n 中是均勻分布的.试证边缘分布是均匀的，并 


①另一特殊情形巳在第1卷 15.13 节 （13.3) 和 17.9 节 (9.1) 中遇到.注意，除了求和代替了积分并 
且只考《 平稳转 移概串以外， (8.19) 是第1卷 15.1 节（1.1>马尔可夫链的*串定义的类似定义. 
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且X + V有相同的分布（好像X和 K 是独立的).① 

提示：图形表明计算是不必要的. 

2. 其有正态边緣密度的密度.令 u 是直线上的连续奇函数，在二!：！外等于 0. 如果 
M<(2« e )-i, 则 

n(x)n(y) + u(*)«(») 

表示一个二元密度，它不是正态的，但它的边缘密度却都是正态的尼尔生 (E. Nelson). 

3. 第2个倒子.令 奶和仰 是两个具有单位方差，但不同相关系数的二元正态密度.混 
合密度 + 仍） 不是正态的，但是它的两个边沿密度与 n —致. 

注在后面，所有的随机$董都在 R 1 中. 随机向 I 用对供 (Xi,X,) 表示，等等. 

4•令；^ ，…， 是具有相同密度/和分布函数 F 的独立随机变童.如果X是其中最小 
#, Y 是其中最大者，则对偶 (X,Y) 的联合密度由下式给出， 

n(n- l)/(*)/(v)[F(») - F(*)] n - a ,y > 


5. 证明： R 3 中的对称 Cauchy 分布（在 (1.21) 中定义的）相应于一个随机向量，它的长 
度具有密度 v(r) = ^-'^(l + r 3 )- 2 , 式中 r > 0( 提示，利用极坐标，并且利用 (1.15) 
或 1.10 节 (10.4) 关于射影的一般关系式). 

6. 对于柯西分布 (1.21), 在给定 XuXif X 3 的条件密度是 


»»«1 .«»(*) 

而在给定 { 下 X 2 、X 3 的二元条件密度是 


( 1 + 疔+铨 + #) 2 ’ 


+ € a 


(i + € 2 + i/ 2 + * a ) a 


7. 令 0 < a < 1, 并且对于 x>0,v> 0，/(ar, V > = [(1 + oi)(l+ay)- 在其 

他地方， f(x, y) = 0. 

(a) 试证 / 是对偶 (X,Y) 的密度，求边缘密度和分布函数. 

(b) 求条件密度⑼和 E(K|X),Var(y|X). 

8 •令 /是集中在 0,oo 上的密度，设对于: c > 0,y > 0,u(x,y) = /(*+ y)/(i +v)； 在其他 
地方， u(x,y) = 0•试证 u 是 R 2 中的密度，并求它的协方差矩阵. 

9•令 X lt X a ,X 3 相互独立且在 i5rr 上均匀分布，令 X W ,X W ,X W 是相应的顺序统计 
1：,试求对偶 

( M ㈤ 

\X W ' X (a) J 

的密度，并证明这两 个比是独立的.试推广到 n 维中去. 

①换句话说，即使变 S 是相关的.和的分布也可以由卷积给出.这个直现的倒子由罗宾斯 （H. E. 
Robbins) 提出的，对于同一类型的另一不同一般的例子可见 2.4 节 （c). 
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10. 令 X U X 2 ， X 3 是具有相同指数分布的独立 变量. 试求 （ X 2 - XuXs - Xi ) 的密度. 

11. ^•单位质量的质点分裂成2个具有质量 A •和1 - X 的碎片 . X 的密度/集中在 
0^±,由对称性， /(*) = /(I - *) •用&表示较小的碎片， X 2 表示较大的碎片.这 
两个碎片以同样的方式独立地分裂，得到4个具有质量 X 11 , X 12 , X2i , X 3 , 的碎片.试 
求， （ a ) Xn 的密度； （ b ) 和 X 12 的联合密度.利用 （ b ) 来验证⑷中的结果. 

12. 令不, 1 2 , ••是独立的且有相同的正态密度 n , S * = Xi + --+ X fc . 如果 m < n , 试 
求 （ S m , S „) 的联合密度及在给定 S „= t ~ fS m 的条件密度. 

13. 在上题中，试求在给定汾+…+幻下 x ? + • • m 的条件密度. 

14•令 pf , y ) 具有中心在原点的二元正态密度，并且 e ( x 2 ) = E ( y a ) = i , E ( xr ) = p .在 
极坐标中 ，（ X , y ) 变成 ( R ,0), 其中 r 3 = x 2 + Y a . 试证在密度为 

_^1 — P 1 

2n(l — 2pmnifiooBtpY < V < n , 

并且为使它是均匀分布，当且仅当 p = o .推出 

P{^XY > 0} = - + Ji _1 arc 8 inp 和 P{XY < 0} = n ~ 1 aiccoap . 

15. 令/对于顶点为 （0, 0), (0, 1), (1, 0) 的三角形是一个均匀密度， g 对于第3象限内的 
对称三角形是一个均匀密度.试求/ • /和/ • fl . 

注意， 应对各个区间作令人乏味的分别考虑. 

16. 令/是单位圆上的均匀密度.试在极坐标中求 /•/. 

17. 令 U 和 v 是在 R 2 中具有下列形式的密度： 

«(*.») = fW ^ 3 + » 3 ). «(*,») = g (. y / x 2 + y 2 ). 

试在极坐标中求 n * v . 

18•令义=, •.. , X r } 有 r 维正态密度.存在一个荦位向 ft <* = ( oi ，…, a r ) ,使得对于 
所有的单位向* C = ( Cl ，…, C -), 

Var(aiXi + ... + OrX r ) ^ Var(ci^fi + • • • + CrX r ). 

如果 a = (1,0,•••,()) 是这样的一个向量，那么 A 与其余的 Xj 独立. 

19. 试证 

定理给 定一个 IT 中的正态密度，郢么坐标耘可以用这样一种方法来旋转，使得新 
坐标变量是相互独立的正态变量. 

换句话说，在 3.6 节定理2中，矩阵 C 可以取为旋转矩阵. 

提示 I 令 y = XC , 选择这样的旋转矩阵 （7, 使得 

Yr = aiXi + • • ■ + OrXr , 

其中 a = 是上例中的最大向量.其余部分是容易的. 
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20 . 试求满足下式的一般正态平稳过程 I 

( a ) X „ +3 + Xn = 0, 

( b ) X n +2 — X n = 0, 

( C ) X n +3 — X n +a + X n +1 — X n = 0. 

21. 伺眼随 机过程 米尔斯 （ H . D . Mills ). 伺脤机构受到随机冲击，但是可在任何时间引入校 
正值.因此，在时间 n 的误差 y „ (在适当的单位下）具有形式 Y n+l = y n - C „ + Xn+u 
其中是校正值，為是独立正态变量， E ( X n ) = 0, E ( X ^) = 1. C n 在原则上是过去 
观测值的任意函数，即 U 和 X * (对于 fc < n ) 的任意函数.我们希望这样选出它们， 
使 Var ( V „) (这是机构如何顺利工作的董度）和 Var ( C „) (这是机构如何不顺利工作的量 
度）极小. 

( a ) 讨论 { Y n } 的协方差函数，证明 Var ( y „) ^ 1. 

( b ) 假设 Var ( C „)-* a 2 , Var ( K ») — cr 2 ( 趋向平稳)，试证 

|(a + a _, ). 

( c ) 特别地，考虑线性 fc 置 C „ =a + p { y „—6),0< p < 1,求协方差函数及的形如 
(7.8) 的表示式. 

22. (蠄 上). 如果在信息中或在调节中有时潷，则除了 C „ 换为 C n + N 以外，供型在本质上 
是相同的.讨论这种情况. 




第 4 章概率测度与概率空间 

正如引言所述，本卷很少用到测度论这一专门的工具，不读本章也能阅读本书 
的大部分内容 .® 但我还是简单叙述一下构成本书理论基础的基本概念，并且为便 
于参考引用，列出主要的定理.基本的思想和事实并不难理解，但测度论的证明依 
赖于复杂的技术细节.对 T 初学者和没有专门知识的人来说，测度论的许多方面和 
应用也可能引起 困难； 极好的入门书是有的，但它们必然要详细论述广泛的和对本 
书来说是不重要的内容，下面只介绍本书所需要的内容，省略了许多证明和技术细 
节®.(公正地说，这种理论的简单性是表面的，因为连续时间参数随机过程中会 
出现相当困难的测度论问题，条件期望推迟到 5.10 节和 5.11 节中讨论，拉东-尼 
科迪姆 （ Radon - Nikodym ) 定理推迟到 5.3 节中讨论 •） 

只要规定 a ; 是的简写，则与笛卡儿 （ Cartesian ) (或欧几里得 ( Eu ¬ 
clidean )) 空间 IT 有关的公式与维数无关. 


4.1 贝尔函数 

我们必须选定一类可以定义概率的集合和一类可以作为随机变量的函数•这 
两个问题不仅有联系，而且它们的讨论可以用一个近代的概念统一 起来. 我们从引 
入此概率和回忆用单调极限表述的收敛的定义开始. 

集合力 的指示 A 數®是一个在4的所有点上取值为1,而在欠的余集 W 的所 
有点上取值为 0 的函数.我们将用表示它，于是当 a: e 4 时 l A (x) = 1, 而在其 
他地方 14(*) =0_ 每个集合都有一个指示函数，而且毎个只取 1 和 0 为值的函数 

①这对热 悉测度 论的读者及只对结果和亊实感兴*的读者都 合适. 为了后者的方 ft , 我们将在 5.1 节 
中重述积分的定义.除此之外，他们丐以依 a 自己的直观想象，因为测度论实际上证明了简单的形 
式运算是正确的. 

® 有关贝尔 ( Baire ) 函数和勒贝格-斯蒂尔切斯 （ Lebesg — Stieltjes ) 积分的极好参考书是， E . J . 
Mcshane and T . A . Botts , Real analysis , D . Van Noetrand , Princeton , 1959. 广泛使用的一 
般测度论的书是， P . R . Halmoe , Measure Theory , D . Van Nostrand , Princeton , 1950,和 N . 
Bourbaki , Eldments de matWmotigues[livre VI , chapters 3—5] HermBan , Paris , 1952 和 1966. 
关于*率论特殊用途的文歎可参见杜布 ( Doob ). 克里克别格 ( Krickeberg ). 洛埃韦 （ Lo ^ ve )、 涅 
烕 ( Neveu ) 以及亨涅奎因-托尔特拉特 ( Hennequin - Tortrat ) 等人的书. 

③这个术语是洛埃韦 ( Lofeve ) 引入的.过去 的术* •特征函数―在概串论中容易引起混乱. 
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必是某个集合的指示函数.如果/是任意一个函数，那么乘积1^/是一个在4上 
等于/而在其他地方等于0的函数. 

现在我们来考虑两个集合的交集 C = Af \ B . 它的指示函数在 1 a 或 1 b 为0 
时等于 0 ,即 l c = inf ( lM , l B ) 等于这两个函数中的较小者.为了利用这一平行关 
系，我们把在每一点 a : 上等于/⑷和 gOc ) 的值中的较小者的函数记为/门3,而 
不记为类似地， f\Jg = sup ( f , g ) 表示二者中较大者 ® 算子门和 U 分别 
称为求交运算和求并运算，它们适用于任意个数的函数，我们记 

An -n/n = HA, au … u/n = 0 a. (i.i) 

< e=i k=i 

在每一点 A 这些函数分别等于 n 个值 / i ( x ),---,/ n ( x ) 中的最小值和最大值.如果 
f k 是集合小的指示函数，那么 （ i . i ) 式表示交糸门… n 匙和并山 u … u 烏的 
指示函数. 

现在考虑无穷序列 {/ n }. (1.1) 式中定义的函数单调地依赖 T n , 因而极限 
0 a 和 n h 是完全确定的，但可能是无穷.对于固定的么 

fc=i fc=i 

wj = n/k (1.2) 

k=j 

是单调函数列 /j D " - n / i + n 的极限，序列{%}本身也是单调的，即叫=奶 u … 

LH 利用我们的记号， — G 叫.根据定义，叫是数列 /„0 c )，/„ +1 ⑻，…的 
<：=1 

最大下界（下确 界). 因而的极限和 liminf / n 相同，于是 

limLnf / n = U HA - (1.3) 

i = i*=i 

这样， Hminf 是通过两次取单调序列的极限得 到的. 对于 limsup / n , 我们只需把 
(1-3) 式中的 A 与 U 交换一下. 

所有这些考虑都可照搬到集合上去.特别，当且仅当 lx = liml A „ 时，我们记 
A = hmA n . 换句话说，当且仅当4的每一点除有限个集合外属于所 有的九 >， 余集 
A ： 的每一点最多属于有限个时，集列 { A n } 收敛到 A 
例 （ a ) 集合{七作为概率论中集合之间极限运算的重要例子，我们考虑 
一个事件 A 它定义为“在给定的事件序列 A l , A a , - 中有无穷多个事件发生”[特 
殊情形已在第1卷 8.3 节(博雷尔-坎泰利 (Borel Cantelli ) 引理)和第1卷第13章 
(循环事件）中考虑过].更正式地说，给定一个集合序列 { A n }, 当且仅当工厲于无穷 

①许多作者建议对函数用符号 v 和 a , 对集合用符号 u 和 n . 在本书中，用两种记号没有奸处. 

® - Ani . 0••是 -An infinitely often * 的缩写，读作 . An 无穷多次发生 • . - 译者注 
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多个 yl fc 时 a : 属于 A 因为0和1是指示函数仅有的可能值，所以这个定义的等价 
说法为 1 a = limsuplA „. 因而用标准的记号应有 *4 = limsup 人， 但记号{_4„ i.o.} 
更具有启发性.这个记号应归功于钟开莱. 

我们的下一个问题是要确定 IT 中的一类函数 ®, 以后我们将讨论这类函数. 
任意函数的概念对于我们的目的来说太广泛，因而不能应用.欧拉 (Euler) 的函数 
概念的现代说法是比较合适的.设连续函数为给定的，构造新函数的唯一有效方法 
是通过取极限.实际上，只要我们知道怎样处理连续函数序列 {/„} 的极限函数，或 
每个 / n 都是这样一个极限的函数序列 {/„} 的极限函数，等等，我们所有需要就都 
能满足.换句话说，我们对具有下列性质的函 数类® 感兴趣< ⑴每个连续函数属 
于 ® ; (2) 如果 A, / 2 ,…属于®,且极限 /(*) = lim f n ( x ) 对一切: c 都存在，则/属 
于®.称这类函数在点态极限下封闭.毫无疑问，这样的函数类是存在的， 所有的 
函数所构成的类就是这样一个函数类.所有这样的类的交本身是一个封闭族，它显 
然是这样的类中的最小者.我们只考虑这个最小类. 

包含一切 连续* 數的最小封數类称为贝尔类，并用 ® 表示它 .© 中的函 
數称为 贝尔* 數 .® 

我们不仅对定义在整个空间上的函数，而且对只定义于一子集上的函数(例如 
R 1 上的斤或 In *) 利用这个概念. 

由定义易知，两个贝尔函数的和与积还是贝尔函数，这对多个函数也是正确 
的. 如果 W 是一个 r 元连续函数，是贝尔函数， 那么 还是贝 
尔函数.把 W 换为1«„,并取极限，可以证明，更一般地有，贝 尔函數的复合函數还 
是贝尔 函数.固定一个或几个变量的值后得到的函数仍是贝尔函数，等等.简单地 
说，在贝尔函数类中经初等运算得到的函数仍厲 于®, 因而是我们分析的一个自然 
对象.事实上.通过考虑更小的类，不可能起到简化的作用. 

4.2 区间函数与在 IT 上的积分 


我们将利用区问一词，并对满足下列4种双向不等式之一的点集，使用下列所 
表明的记号 ■ 

①上，我们只对有隈值函数感兴*,但为方便有时也允许取 ±oo 为值.例如，毎个单调序列鎘有 
极限这个簡单定理，对有限值函数是成立的，而且若没有它许多系统的叙述将变成笨抽的.因此，我 
们约定，所有的函数的值域可扩展到*个直线上，即它们可取 ±00 为值.实际上，值 ±00 不起作 
用.为了使两个函数的和与积仍为函数，对它们的值，我们约定 00 + 00 = 00,00 - 00 = 0, 00-00 = 
oo,0 •oo = 0, 等等. 

® 这个定义依赖于连续性的*念.而不依赖于笛卡儿空间的其他性质.因此，它适用于任意的拓扑空 
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a , b : a <x < b , a,b : a < x ^ b , 
a,b : a ^ x ^ b , a , b : a ^ x < b . 

在一维中，这包括了所有可能的区间（包括长度为0的退化区间在内).在二维中， 
把不等式理解为各个坐标分董的不等式，诸区间是平行于坐标轴的（可能是退化的） 
矩形.其他的部分闭包类型是可能的，但这里我们不考虑它们.把 a 或6的一个或 
几个坐标换为 ± oo 的极限情形是允许的；特别地，整个空间是区间 =55^55. 

点函数/对单个点賦予值 /(*). 集*數 F 对集合或空间的区域賦予值 . R 3 中 
的体积、 R 2 中的面积或 R 1 中的长度都是典型的例子.但还有很多的例子，概率是 
我们最关心的一种特殊 情形. 我们只对具有下列性质的集函数感 兴趣： 如果集合4 
被分成两个 集合木和也, 那么 F { A } = F { A 1 } + F { A 2 }. 这样的函数称为町加集 
函数.① 

正如我们所看到的那样，常常会发生这样的 情况： 对7•维空间 IT 中的一切区 
间都定义了概率我们希望把它扩张到更一般的集合 上去. 在初等微积分中也 
有同样的问题，在那里面积（容度）本来只是对矩形定义的，我们希望定义更一般 
的区域4的面积.最简单的办法是先定义二元函数的积分，然后把指示函数 1 a (即 
在>1上等于1而在>1之外等于0的函数）的积分看成 M 的面积”.同样,我们将 
定义点函数《关于区间函数 F 的积分 

E ( u ) = f u (®) F { da :}. (2.1) 

jR r 

然后把 A 的概率定义为 E (1 A ). 在积分 (2.1) 的定义中， F 的意义不起作用，实际 
上我们将叙述勒贝格-斯蒂尔切斯 ( Lebesgue - Stieltjes ) 积分的一般概念.现在我们 
从头开始研究. 

设 F 是一个对每个区间 J 賦予有限值 F {/} 的函数.这样的函数称为（有限)可 
加的，如果对 T 把区间 J 分成有限多个不相交的区间 /!,•••,/„ 的任一划分， 

F{/} = F{/!} + ••■ + F{/ n }. (2.2) 

例⑷ R 1 中的分布. 在第1卷中，我们考虑了对于点 aw . 賦予概率 p 1)P2 , ••- 
的离散概率分布.这里 F { J } 是 J 中的所有点 a „ 的概率 p „ 之和，并且 E ( u ) = 
X >( On ) Pf »_ 

例 （ b ) MG 是任意一个从 _ oo 为0增加到 oo 为1的单调增连续函数，则可 
以定义 F {^ b } = G ( b )~ G ( a ). 

①可加集函数的实际例子是质量、区域中的热量、土地价格.小麦亩数、一个地区的居民人数、煤的 
年产*、一个时期中乘客飞行里数或消耗的千瓦小时数、电话呼叫次数等. 
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例 （ c ) R 2 中的随机向量.具有单位长度的向量从原点以随机的方向出发.它的端 
点位于一个二维区间 J 中的概率与 J 和单位圆的公共部分成正比.这样就定义了一 
个没有密度的连续概率分布.在整个概率被圆周所占有这个意义上，这个分布是奇 
异的.人们可能认为，这样的分布是不自然的，应该把圆周而不是平面作为样本空 
间.反对意见是站不脚的，因为两个独立的随机向量之和的长度可取0和2之间的 
一切值，并且在半径为2的圆内有一个正密度[见 5.4 节例 （ e ) j . 因此，对一些涉及 
随机向董的问题，自然的样本空间是平面.总之，我们的目的是用简单的例子来说 
明在较复杂的情形可能发生什么情况 • 

例 （ d ) 我们以一个说明以后要排除的可能性的例子来作为结尾.在 R 1 中，对于 
任一区间 J = 0( 其中6 < oo ), 令 F {/} = 0;当 J = S ； 面时，令 F { I } = 1. 这个 
区间函数是可加的 ，但却 是奇特的,因为它违反了自然的连续性 要求： 当 6 — 00 
时， F {^ b } 趋于 Fj ^ o }. ► 

最后一例表明了加强有限可加性条件 (2.2) 的重要性.我们将称一个区间*数 
F 是可数可加的或 a 可加的，如果对于把一个区间 J 分成可數多个区间 - 
的分划，都有 

F { I } = Y , nh }. (2.3) 

[*• 可数多个”表示有限多个或可列多个.术语完全可加与可数可加是同义的.在最 
后一个例子中，条件 (2.3) 显然不成立 .1 

我们将把注意力完全局限于可数可加集函数.从理论上巳证明这种做法是正 
确的，但也可从启发性的角度或实际的角度为这种做法辩护.事实上，如果 A „ = 
AU 〜 UJ „ 是前 ri 个区间的并集，那么人―人们可以 论证: “对于充分大 
的与/实际上是无法区别 的”. 如果 F {/} 可用试验求出，那么，与 
F { I } “实际上是无法区别的”，即 F {^,} 应当趋于 F { I }. 可数可加性 (2.3) 准确地 
表达了这个要求. 

由于我们只对概率感兴趣，我们将只考虑由条件 F {^3^5} = 1所正规化的 
非负区间函数 F •当< oo 时，这种正规化并没有加上什么严格的限制， 
但这种正规化排除了像 R 1 中的长度和 R 2 中的面积这样的区间函数.为了在这种 
情形下利用以下的理论，只需把直线或 平面划 分为单位区间并分别讨论它们就行 
了. 这种过程是显然的且为大家所熟知，因此不需要进一步说明了. 

R r 中的函数称为阶梯函數，如果可以把分成有限多个区间，使得在每 
个区间上此函数取常值.对于在区间上分别取值句，…，如(即具有概率 
F { h },---, F { I n }) 的阶梯函数 tx ， 类似于离散随机变量的期望的定义，我们令 

£(«) = <1，{八} +… + o „ F { J „}. (2.4) 


[把空间分成区间使得在每个区间上 u 取常值的划分方法是不唯一的，但和离散情 
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形一样，容易看出定义 （2.4) 与分法无关 .] 这个期望 E ㈦ 满足下列条件： 

( a ) 线性组合的可 加性： 

E(aiUi + o ；2 U 2) = aiE (« i ) + a ：2 E ( U 2); (2.5) 

( b ) 正性： 

u >0 蕴含 E ( u ) ^ 0; (2.6) 

( c ) 正规性：对常数函数 

E ( l ) = 1. (2.7) 

最后两个条件等价于中值 定理： a 《 u 彡卢蕴含 a < E («) < 0, 因此函数 E ( u ) 
表示一种平均值 .® 

问题是要把 E ( u ) 的定义扩张到更大的函数类上去，且保持性质 ( a )~( c ). 经典 
的黎曼 （ Riemann ) 积分利用了下列 事实： 对于 U 上的毎个连续函数存在一个 
阶梯函数列使得在5^上一致地有 un ^ u . 于是由定义， E ( u ) = limE ( u „). 亊 
实上，收敛的一致性是不必 要的； 当处处收敛到《时，还可利用 E ( u ) 的同一 
定义.因此，可以把 E («) 扩张到所有有界贝 尔* 教上去,并且这种扩张是难一的. 
当函数无界时，积分的发散是不可避免的，但至少对于正的贝尔函数，可把 E ( u ) 
定义为数或符号 oo ( 表示发散).在这一方面不会产生麻烦，因为勒贝格积分理论只 
考虑绝对可积性.粗略地说，从简单函数的期望的定义出发，可以通过明显的通近和 
极限手续来对一般的贝尔函数定义 E ( u ). 这样定义的数 E ( ti ) 是 u 关于的勒贝 
格-斯蒂尔切斯 ( Lebesque - Stieltjes ) 积分.（当基本函数 F 保持固定从而不会发生 
混淆时，期望这一术语是更可取的 .） 这里我们不加证明地叙述 ® 勒贝格理论的基本 
事实，它的性质和范围将在下面的几节中加以分析. [ E ( u ) 的构造性定义将在 4.4 节 
中给出 .1 

主要定理设 F 是 R r 上的可數可加 区间* 數，并且 F {- oo , oo } = l . 对任一历尔 
函数类存在唯一的一个勒贝格-斯蒂尔切斯积分 E ( u ), 使得：如果 U >0, 則 E ( u ) 
是一个非负數或 oo . 另外，为使 E ( u ) 存在，当且仅当 E ( u +) 或 E ( u -) 有限. 在这 

①当 f 表示概率时， B ( u ) 芎以解释为一个 _» J 能贏得数*为 ahOf ••的贏金的赌徒的期篇赢金*. 
为理解其他情形下 的直观 意义，考成3个例子，其中 u ( z ) 分别表示在时刻 n 的 ® 度，在时« s 的 
电话通话次败，质点到原点的距离，而 F 分别表示时间 K 间的长度，一个时间区间内的电话费，力 
学中的质*.在每种情况下，积分只在一个有限区间上进行， E ( u ) 将表示累积 *» 度小时•，累积 
贏金，和一个静力矩.这3个例子表明关于任意集函数的积分比黎曼 （ Rlemann ) 积分更筒单.更 
直观.在黎曼积分中，独立变置起着不止一种作用，•曲线下的面积■•对初学者也无帮助.应该注意， 
期里 的氰念 只在*率论中出现. 

® 证明方法将在 4.5 节中给出. 照例, u + 和 11— 表示 u 的正部和负部，即 tx + = uUQ ,-^*-=«* no . 
因此 ， u = «+-«-. 
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种情形下， E ( tt ) = E ( ti +)- E ( tt -). 函數 u 称为是可积的，如果 E ( u ) 是有限的，于 
是 

⑴如果 u 是一个阶梯函数，則 E ( u ) 由 (2.4) 式 给出； 

( u ) 条件 （2.5) 〜 (2.7) 对所有的可积函数却 成立； 

( UI ) (单调收敛原理)设 u , ^ « 2 < —— ► u , 其中 u „ 是可积的，那么 E ( tt „) — 

E(«). 

变 M 替换叫 = Un +l -Un 可以导致最后一个原理的级数 描述： 

如果 w „ 可相，且 u n > 0,則 

5>(t;„) = E(5>„) (2.8) 

[在两边都有意义（有限）或都不存在的意义上1成立.特别地，由此推出，如果 
« > t * > 0,且 E ( u ) = oo , 则也有 E ( w ) = oo . 

如果在 （ iii ) 中把单调性条件去掉，那么将会发生什么情况？答案依赖于一个有 
广泛应用的重要引理. 

法明 ( Fatou ) 引理如果 u n 彡0且 u n 可积，則 

E(lim inf u „) ^ lini inf E ( Un ). (2.9) 

特别地，如果 u n —♦ u, 則 liminfE(un) ^ E(u). 

证令 = u „ 门 u„+i 门…，于是 u n < 从而 
E(«n) 彡 E(u„). 

但是（正如在 4 .1 节所看到的那样 )， 单调地趋于 Iimixifun , 因此 E ( w n ) 趋于 (2.9) 
式的左边，引理得证. | 注意， (2.9) 式的每一边都可以是 oo .] 

正如将在例 （ e ) 中说明的那样，正性这一条件不能去掉，但可以换为一个形式 
上较弱的 条件： 存在一个可积函数 f ；， 使得 U „ >认（只要把换为- 1/即可 •） 
把换为 - Un , 我们可以看出，如果 W < [/ 且 E ⑷ < OO , 则 

limsupE ( un ) < E ( limsupu „). (2.10) 

对于收敛序列， E(liminf u „) = EOimsupUn ), 把 (2.9) 式和 (2.10) 式结合起来就得 
到重要的. 

控制收敛定理设 《n 可积且处处收敛于 U . 如果存在一个可积的 V 使得对所 
有的 n 有 | u „| 矣 i /， 則 U 是可积的，且 E ( u „)-* E ( u ). 

在勒贝格理论中只有一个这样的地方，在那里自然的形式运算可能导致错误 
的结果，上面的定理就与这个地方有关.条件 | u „| < I /的必要性将由下例说明. 

例 （ e ) 我们取 U 为基本区间，并用通常的积分（关于长度的积分）来定义期望. 
令 
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« n (*) = (n + l)(n + 2) x n (l -*). 

这些函数处处趋于0,但是却有1 = E ( u n ) — 1.把 u „ 换为-«„，可以看出,法图不 
等式 (2.9) 对非正函数不一定成立. 

我们不加证明地给出一个可适用于更一般情形的普通微积分定理. 

关于累次积分的富比尼 （ Pubini ) 定理如果 u > 0是一个贝尔函數， F 和 G 是 
概芈分布，則 

[ F { dx } ( u ( z ， w ) G { dy } 

J —oo J —oo 

= f Gjdy } f u ( i , y ) F { da :}. (2.11) 

J—oo J—oo 

在发散的情形按通常的办法解释.这里 a : 和 y 可以解释为 R m 和 R " 中的点，此定 
理蕴含了如下的 断言： 两个内层积分都是贝尔函数.（此定理适用于任意的乘积空 
间，在 4.6 节将给出此定理的一种更好的形式 .） 

平均逼近定理对每个可积的 u 和 e > 0,可以找到一个阶梯函数 u , 使得 E (| u - 
u|) < e. 

除了阶梯函数，我们还可以用连续函数，或有任意多阶导数且在某一有限区间 
外为零的函数来逼近.[试与 8.3 节中的逼近定理相比较 .] 

关于记号的注记号 E ( u ) 强调对 u 的依赖性，在区间函数 F 是固定的情况下，这 
种记号是实用的.当 F 可变化或要强调对 F 的依赖性时，积分记号 (2.1) 更可取. 
它也适用于在子集 A 上的积分，因为根据定义， U 在 X 上的积分等于乘积 l A u 在 
整个空间上的 积分. 我们记 

j * «( i ) F { da ;} = E ( 1 , 4u ) 

(当然要假设指示函数1 4 是一个贝尔函 数). 两边表示完全相同的内容，左边强调 
对 F 的依赖性.当4 是一个区间时，通常采用记号 j ' 但要想表达得更淸 

楚，还需说明端点是不是在此区间内.这可以用 a + 或 a - 来°表示. ► 

按照本节一开始所述的程序，我们现在把集合>1的概率定义为 E ( 1 A ), 其中 
1 a 是一个贝尔 函数； 对其他集合，不定义概率.我们将在更一般的样本空间中讨论 
此定义的推论. 


4.3 o ■代数和可测性 


在离散的样本空间中，可以给样本空间的所有子集賦概，但一般来说这既不可 
能又不必要.在前几章中，我们考虑了欧几里得 ( Euclid ) 空间 R r 这一特殊情形， 
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而且我们是从对所有的区间賦概开始的.在上一节中业已指出，可以以自然的方式 
把这种陚概扩张到一个更大的集类 U 上.这集类的主要性 质是： 

⑴若4属于 IX ,则它的余集 A ' = €- A 也厲于 U ; 

( ii ) 若{人}是11的一个可数子集，则 U 4 n 和门人也厲于让 
简单地说， il 是这样一个系统，它在余运算、可数并运算、可数交运箅下封闭. 
正如在 4.1 节中所述的那样，这还蕴含 • U 中的任一集列 { A n } 的上、下限仍属于 U . 
换句话说，对 U 中的集合施行任一种熟知的运算，所得到的集合都不会跑出 tl 的 
范围，因此我们没有必要考虑其他的集合.这种情况是典型的，因为一般说来，我 
们只对具有性 质⑴和 （ ii ) 的集类賦概.因此，我们引入下面的适用于任意空间的 
定义. 

定义1 cr 代數®是一给定臬合 e 的满足性质⑴和 （ ii ) 的子集族. 

对 (£ 的任一给定的子集族 S , 包含 S 中所有集合的最小代數称为由 S 产生 
的 cr 代數. 

特别地，由 IT 中的区间产生的集合称为 IT 中的博當尔 （Borel) 集. 

由 4.1 节贝尔函数的定义中所用的论证可知，包含 ff 的最小 a 代数是存在的. 
注意，是任一集4和它的余集的并，每个 <7代数包含空间 《£. 

例最大的 (7 代数是 C 的所有子集构成的集族.在离散空间中,这个代数是可用 
的，但是对一般的应用却 太大. 另一个极端情形是只包含整个空间和空集的平凡代 
数.要找一个非平凡的例子，我们考虑直线 R 1 上具有下列性质的集合：如果 ; r e A 
则所有点1，*±2,…都厲于 >1( 周期集).显然,所有这样的集族构成一个《7代 
数. 

我们迄今的经验表明，概率论的主要研究对象是随机变撤，即样本空间中的某 
些函数.我们希望把随机变 M X 与分布函数联系起来，因此必须使事件 {X < G 
具有概率.这就导 致了： 

定义2 设 ii 是由 e 的臬合组成的任一 <7代教.称 e 上的*數 u 为 u 可測的®， 
如果对每个所有使 u ( x ) ^ t 的点 ! E 所组成的集合都属于 1 L 

因为 { i , u ( x ) < 4} = : «(*) < « -1 }.所以 { a ： : u ⑻ < t } 也属于 II ■因 

为 U 在余运算下是封闭的，所以在上面的定义中，可以将符号 < 换 <，> 或夂 
由定义可知，在 4.1 节所述的意义上 ， il 可測函數构成一个封闭糸. 

下列简单引理是常用的. 

①把 （H) 中的•可数-一词換为•有限 •， 可类似地定义集代数_ <T 代数常称为博當尔 (Borel) 代数， 
但这容易和定义的最后一部分相《淆.在定义的最后一部分中.可以把区闸換为开集，从而此定义 
适用于一»的拓扑空间. 

® 这个术语是不恰当的，因为还没有定义测度. 
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引理1 函数 u 是11可測的充要条件为，它是一列简单函數的一致极限.所谓* 
教 v 是简单 兩數， 是栺可把 e 分成可數多个集合，每个集合都属于从且 w 在每个 
这样的集上都取常值 • 

证由定义，毎个简单函数都是 U 可测的；由于所有的 U 可测函数构成一封闭系， 
所以简单函数列的极限也是 U 可测的. 

反之，设 U 是 U 可 测的. 对于固定的 e > 0 ,&XAn = { x : ( n - l)e < u (*) < ne }, 
这里 _oo < n < + oo . 集合是互不相交的，而且它们的并是整个空间 6. 在集 
人上,我们定义 ^( x ) = ( n - l )€, ff e ( x )= n €. 这样我们就得到两个定义在6上的 
函数&和心,并且在所有的点上， 

2* 彡 u < - 2« = «• 

显然，当 e — 0 时 ， &和 A 都一致地趋于 u. ► 

引理2 在 RT 中， 贝尔* 數类和关于所有博當尔集合构成的 <7代數 U 可測的* 
數类相等. 

证 （ a ) 显然，每个连续函数都是博雷尔可测的.由于博雷尔可测函数构成一个封 
闭类，而贝尔函数类是包含所有连续函数的最小封闭类，所以每一个贝尔函数都是 
博雷尔可测的. 

( b ) 上一引理表明，要证逆命题，只需证明每个简单的博雷尔可测函数都是贝 
尔函数就行了.这等价于如下的断言：每个博雷尔集4的指示函数1^都是贝尔函 
数.现在可以这样定义博雷尔集：当且仅当>1的指示函数 1 a 厲于包含所有区间的 
指示函数的最小封闭类时，称4是博雷 尔集. 因为贝尔函数类是一个包含所有区 
间的指示函数的封闭类®,所以每个博笛尔集 A 的指示函数1/都是贝尔函数. 

我们把这个结果应用于欧几里得空间 IT . 在 4.2 节中，我们从一个完全可加 
的集函数出发，对于其指示函数 U 是贝尔函数的集合 A 定义了 = E {1 A }. 
由上面的结果可知，在这一狂序下，当且仅当>1是博當尔集时，概芈 P {4} 有定 
义. 


用区间来逼近博當尔集.由上面最后一个断言可知， IT 中的概率通常是定义在由所 
有博雷尔集构成的 <r 代败上的，因此下面的结果是有意义的， 任一博 當尔集 A 都可用由有 
沪良个区间组成的集 B 来逼近，即对毎个 e > 0,存在一个集合 （7, 使得 P{C> < e ，且在 C 外 
集合4和集合 S 相等（即余集 C' 的点或者同时属于4和 B, 或者既不厲于4也不厲干 
B . 我们可以把 C 取为和 S-AB 的并). 


①为证这一点， Xt 开区间/,令《是一个在区间 J 外为零的连续函败，且使得对I 6/,0< «(®) ^ 1. 
那么 tya —* 1/. 
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证由 4 . 2 节的平均逼近定理，存在一个阶梯函数》> 0,使得 EdU -«|) < •设 B 是 
所有使 《(*) > |的点; r 构成的集合.因为 r 是阶梯函数，所以丑由有限多个区间组成•容 
易验证，对于所有的 


E | lx ( a :) - 1 b (*)| ^ 2 E | lx ( x ) - u (*)| < e . 

设 C 7 是所有属于4或 B 但不同时肩于>1和 B 的点组成的集合，则它的指示函数是 
|1 a -1 b |. 上面的不等式说明 P { C } < e , 结论证毕. ► 


4.4 概率空间和随机变置 


我们现在可以叙述概率中所用的一般体 系了. 不管样本空间6如何，我们只对 
适当的 <7代数11中的集合賦概.因此，先给出下 面的： 

定义1 £的某些子集构成的 ( T 代數 It 上的板牟測度 P 是这样一个函數，它賦予 

u 中的每个集乂 一數值 PM} > 0, 使得 p{€} = 1, 并对 a 中任意可數个互不相交 
的集合 

P { UA .} = E p {^>- (4.1) 

这个性质称为 完全可 加性，概率测度可以描述为 u 上的一个满足正规化条 
件$?{«£} = 1的完全可加非负集函数. 

在具体的情况下，必须选择适当的0■代数，然后在它上面构造概率测度.构造 
的方法随情况而变化，不可能找到一个一般的 方法. 通常可以类似于 4.2 节中在 IT 
中的博雷尔集上构造概率测度的方法进行 构造. 典型的例子是由独立随机变量序列 
提供的（ 4 .6节).任何一个概率问题的起点都是这样一个样本空间,在其中已经选出 
了一个带有适当的概率测度的 <7代数.这就导 致了： 

定义2 概牟空间是由样本空间 <!：,(!： 中的某些集组成的一个代數 II ，和 U 上的 
一个概牟測度 P 构成的三元组 (€, ii , P ). 

诚然，不是每一个可以想象得到的概率空间都是有价值的研究对象，但是定义 
包含了为仿照第1卷的样子建立理论所需要的一切东西，而且事先讨论可能在实 
际中出现的概率空间的类型是没有什么用处的. 

随机变童是样本空间中的函数，但为了概率论的目的，我们只能使用能够定义 
分布函数的函数. 4.3 节的定义2就是为了处理这种情况而引入的，它导 致了： 

①条件 P {€} = 1只起正规化的作用，如果把它换为 P { C } < oo . 不会发生什么本质的变化.在这 
种情况下，我们称之为有限测度.在概率论中， P { C } < 1的情况常常发生，在这种情况下，我们 
称之 为亏钡 极丰測度.甚至条件 P { C } < oo 也可以减弱为，€可以分成可数多个互不相交的部分 
，使得 p {€ n } < OO . (长度和面积是典型的例子 .） 这时，我们称之为<7有度. 
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定义3 随机变量 X 是关于基本代数 U 可测的实函數.由 F ( r ) = P{X < r } 
定义的函數 F 柢为 X 的分布函數. 

排除不是随机变童的函数是可以做得到的，因为我们马上就会看到，所有通常 
的运箅，如求和、取极限等，都可在随机变量类中进行.在详细叙述这个问题之前， 
我们先说明，随机变量 X 以这样的方式把样本空间 C 映射到实直线 R 1 上，使得 
<£中的集合 { x ： a < X ( x ) < b } 被映成区间并令^的概率为 F ( b )~ F ⑷•这 
样， R 1 中的每个区间 J 都有一个概率 F { I }. 代替区间 J , 我们可以取 R 1 中的任一 
博雷尔集 A 并考虑 C 中的这样的点 z 组成的集洚使得 X ( x ) 属于 A 用符号表 
示 就是： A = { X € r }. 显然，所有这样的集合所构成的集族是一个 <7代数 
可能和 ii 相等，但是山通常比 IX 小.我们称 14 是由随机变量 _ X •产生的 <7代教. 
可以把它称为 C ： 中的使 X 关于其为可测的最小 <7代数.随机变请 A ： 把叫中的每 
个集合映射为 R 1 中的博雷尔集合 r , 因此关系式 F { r } = PM } 在 R 1 中的所 
有博雷尔集合构成的 <7代数上唯一地定义了一个概率测度.对于区间 / = M , 我们 
有 F {/} = F ( b )- F ( a ), 因此 F 与按 4.2 节中所述的方法由分布函数 F 在 R 1 中定 
义的唯一的概率测度相等. 

这个讨论表明，只要我们只关心一个特殊的随机变童 X ,我们就可以不考虑原 
来的样本空间，而考虑概率空间 ( R 1 ,®,?), 其中®是 R 1 中的所有博雷尔集构成 
的^代数， P 是由分布函数 F 导出的测度.我们已经知道，在 R 1 中贝尔函数类与 
博雷尔可测函数类相等•取 R 1 为样本空间，这就意味着随机变憊类与博笛尔函数 
类相等.在原来的样本空间中解释，这就意味着随机变量 X 的所有贝尔函数所成 
的类，与所有关于由 X 产生的 (7 代数山可测的函数所成的类相等.因为山 c 从 
所以这班含 A " 的任一贝尔函数还是随机变 M . 

这个论证可以照搬到有限个随机变贵所成的集合上.于是 r 元组 ( X u ---, X r ) 
把 ( T 映到 IT 中，使得对于 IT 中的每个开区间，在€：中有一个形如 { a fc < X k < 
b k ,k = l ,- -, r } 的集合与之 对应. 这个集合是 II 可测的，因为它是 r 个 U 可测集 
的交集.与一个变址的情形一样，我们可以把由 X U …， X r 产生的 (7 代数山定义 
为《：中的使得上述 r 个变董关于其为可测的最小 <7代数.于是我们有基 本的： 

定理任何有限个随机变量的贝尔函数还是随机变量. 

如果随机变量关于由 X u -,X r 产生的 <7代數是可測的，則它是 X u ", 
X r 的员尔函數. 

例 （ a ) 在以久作为坐标变量的直线 R 1 上，函数 X 2 产生一个由关于原点对称 
的博雷尔集合组成的 cr 代数（所谓4关于原点对称，是指 ：如果 a ; e A 则也有 
一 x € A). 

例 （ b ) 考虑以 X U X 3 , X 3 为坐标变量的 R 3 和所有博雷尔集合构成的 a 代数.对 
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偶 ( X U X 2 ) 产生一个由所有这样的柱集所成的族，它们的母线平行于第3个轴，底 
是 ( X U X 2 ) 平面上的博雷尔集. 

期望 

在 4.2 节中我们从 RT 中的一个区间函数出发，并利用它构造了一个概率空间. 
在那里我们看到，先定义函数的期望（积分)，然后定义博雷尔集4的概率等于其 
指示函数的期望 E ( 1 A ) 是比较方便的.如果我们从一个概率空间出发，那么程序就 
得倒转 过来： 概率是给定的，必须通过给定的概率来定义随机变憊的期望.幸好这 
个程序是非常简单的. 

同 4.3 节中一样，我们称随机变董 J 7 是简单的，如果可以把样本空间分成可 
数多个不相交的部分 A u A 2 ,- -, 使得每一个冯都厲于基本 a 代数 U , 且 C 7 在木 
上取常值对这样的随机变童，可以应用第1卷的离散理论，只要下列级数绝对 
收敛，我们就把 t / 的期望定义为 

E ( t ^) = 53 a fc PM *}; (4.2) 

当上述级数不绝对收敛时，我们说 t / 的期望不存在. 

对于任一随机变贵和任一 e > 0,我们在 (3.1) 式中定义了两个简单随机变量 
厶和 使得心 = 2* + e 且& <卩彡&.对于 E ( U ) 的任一合理的定义，当变 M 
&和~有期望时，我们应当有 

< E (17) < E ( S e ). (4.3) 

因 为&和 A 只相差 e , 所以或者它们的期望也相差 e , 或者它们的期望都不存在. 
在后一种情况下，我们说1/的期望不存在，而在前一种情况下，在 (4.3) 式中令 
€-*0, 就可唯一地确定 E (£7). 简单地说，因为每一个随机变量 J 7 都是一列简单随 
机变量 < r „ 的一致极限，所以 t / 的期望可以定义为 E (( T „) 的极限.例如， 利用^ 
只要（对某一个 e > 0,从而对所有的 e > 0) 下列级数收敛，则我们有 

E ( I 7) = lim n € P{(n - l)e < t / < ne }. (4.4) 


(4.4) 中出现的概率和 C / 的分布函数 F 賦予区间 （n - l ) e , 的概率相等.因此，借 
助于这种记号的变化， E (17) 的定义化为 4.2 节中的定义 

E ( U ) = J °° tF { dt }. (4.5) 

因此，在原来的概率空间中定义的 E ( t 0 和通过分布函数定义的 E ( C 0 是一致的. 
(在第1卷第9章中对离散变量作了同样的说明 .） 所以，没有必要强调任意概率空 
间中的期望具有 4.2 节所讨论的 M 中的期望的基本性质. 
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4.5 扩张定理 


构造概率空间的通常起点是先在较小的集类上定义了概率，需要把定义域适 
当地扩大.例如，在第1卷中讨论无穷试验序列和循环事件时，我们只知道所有的 
依赖于有限多次试验的事件的概率，但必须把这个定义域扩大，使之包括像输光、 
循环和最终灭亡那样的事件.再如，在 4.2 节中构造 IT 中的测度时，我们是从定 
义在所有区间上的概率 F {/} 出发的，这个定义被扩张成了所有博雷尔集所成的类. 
这种扩张的可能性应归功于一个有广泛适用性的定理，许多概率空间的构造都依赖 
于它.程序如下. 

F 的可加性允许我们对每一个可以写 成有限多个互不相交 的区间4的并的集 
A 明确 地定义 

F { A } = Y , Hh }. (5.1) 

所有形如上面的>1的集合构成一个代教 ilo (即叫中有限多个集合的并、交、余集 
仍然厲于 Uo ) 此后，基本空间 IT 的性质就不起作用了，我们可以考虑任意一个空 
间<£中的任意一个集代数 Ho . 总存在一个包含 Uo 且在可數并和可數交运算下封 
闭的最小代数 U . 换句话说，总存在一个包含 Uo 的最小代数 11( 见 4.3 节的定义 
1) •在 IT 中构造测度时， cr 代数 IX 和所有博雷尔集所构成的 <7代数相等.把概率 
的定义域从 Uo 扩张为 U 是根据一般的< 

扩张定理 设 Uo 是某一空间 C 中的集代数•设 F 是定义在 Uo 上的一个集 函數， 
使得对每个集合 i 4 eilo 都有 F { A }>0, F { C } = 1, 而且当把任意地分成可数多 
个互不相交的集 A eilo 时 (5.1) 式都成立，則 F 可以难一地扩张成为包含 ilo 的 
最小 a 代數91上的一个可敷可加集 A 数（即一个概率測度). 

我们将在下节中给出此定理的一种典型的应用.这里我们给出扩张定理的一个 
更一般更灵活的形式，这种形式与 4.2 节和 4.3 节中的讨论比较 一致. 我们是从阶 
梯函数的期望 (2.4) 出 发的. 然后把这个期望的定义域从有限的阶梯函数类扩张成 
较大的有界贝尔函数类.这种扩张直接导致了勒贝格-斯蒂尔切斯积分， 集合 4的 
测度作为它的指示函数 1 a 的期望而得到.相应的抽象构造如下. 

代替集代数 Uo , 我们考虑在线性组合、运算门和 U 下封闭的函数类 ® 0 . 换句 
话说，我们假设，如果 W 和 U 2 属于®0,那么函数® 

ai«i + a 2 u 2 , uifl «2, uiUu 2 (5.2) 

①我们的假设相当于要求® o 是一个线 性格. 
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也属于特别，这 蕴含® 0中每个函数 U 都可以写成 u = u +- u - 的形式，其 
中1/+ = u | J 0 和 u - = « n 0. 所谓? Bo 上 的线性泛函， 是指 一 从® 0到 R 1 中的 
映射 E(u), 它满足下列加法 法则： 


E(aiui + c*2W2) = aiE(ui) + q ； 2E(M2). (5.3) 

如果 ti > 0蕴含 E ( u ) 彡0,则称此泛函是正的 . E 的范数是对于所有使 | u | < 1的函 
数 U € ® o ,£(| u |) 的最小 上界. 如果常值函数1属于 ® 0 , 那么 E 的范数等于 E ( l ). 
最后，我们称 E 在® 0 中是 可數可加的， 如果当 i7u„ 属于 ® 0 时 

E = S E ( U *) - (5-4) 

一个等价的条件是：如果 {«„} 是®0中一个单调收敛于零的函数列，那么 31 

E(w„) -»0. (5.5) 

给定一个函 数类® 0,那么存在一个包含 ® o 且在点态极限运算下是封闭的最 
小 类®. [它在运算 (5.2) 下自然是封闭的 .j 扩张定理的另一种形式如下 ,®?8 0 中每 
一个范數为1的可数可加的正线性泛函可以唯一地扩张为©中的所有有界（和许 
多无界）函数上的一个范数为1的可数可加正战性泛 *• 

作为此定理的适用性的一个例子，我们来证明下列重要结果. 

里斯 （F. Riesz) 表示定理 35 设 E 是 RT 中所有在无穷远处为零®的连埃兩数所 
成的类上的一个范数为1的正线性泛*,則在博雪尔集构成的 a * 数上存在一个 
測度 P, 使 P{R r } = 1,且使得 E(u) 和 tx 关于 P 的积分相等. 

换句话说，我们的积分代表了最一般的止线性泛函. 

①欲证 （5.4) 与 (5.5) 的等价性，只*考* tifc ^ 0 , v k >0的情形就行了.于是 (5.4) 可通过在 
(5.5) 中令 Vn = Un+1 + tln +3 +… 而得到, (5.5) 式可通过在 (5.4) 中令 Ufc = — Vfc + 1 (即 
Stifc = « i ) rtf 得到. 

® 证明的基本思想（可追*到勒贝格）是两单且巧妙的.不嫌看出， 如果® 0 中的两个函败序列 { tin } 
和 {<} 都单调地收敛于同--极限，则 E ( U „) 和 EK ) 趋于同一 极限. 因此，对这样的单调极限 
u, 我们可以定义 E(u) = limEK). 现在考虑这样的函数 u 所成的类 »1, 使得对每一 e > 0, 
存在两个函数 H 和它们或者在中或者是®0中的单调序列的极限，满足 Si < U < a 和 
E(fi) — E(a) < £ .类在极 R 运算下是封闭的，对于中的函败， E(u) 的定义是旺然的，因 
为我们应当有 E(u)< E(uK E ⑻. 

这个论证的绝妙之处在于，类通常比®大.我们通过证明能把泛函扩张到® J 上而完 
成这个简单的证明.决于®和®的比较，见 4.7 节 .） 

③对任意的局《»空间成立.另一 iE 明见 6.1 节. 

® 如果对给定的 e > 0,存在一个球 （* 集)，在它之外|«(*)| < e ，则称 1* 在无穷远处为 0. 
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证决定性的一点是：如果在无穷远处为0的连续函数序列 {«„} 单调地趋于0, 
则收敛是一致的.设俶 > 0,并令 IKH = maxvja :), 则 E ( v n ) < || v n ||, 从而可 
数可加性条件 （5.5) 成立.由扩张定理， E 可以扩张到所有有界贝尔函数上，令 
PM }= E (1^), 我们就得到一个定义在所有博雷尔集构成的 tr 代数上的一个测度. 
对测度 P , 我们知道勒贝格-斯蒂尔切斯积分由双向不等式 （4.3) 唯一确定.这表 
明，对于在无穷远处为0的连续函数 u , 这个积分与给定的泛函 E ( u ) 相等. 

4.6 乘积空间和独立变置序列 

组合乘积空间（第1卷 5.5 节）是概率论的一个基本概念，每逢谈及重复试验 
时就要用到它.用两个坐标表示平面 R 2 上的点，就意味着把 R 2 看成它的两个轴 
的组合乘积.用 A ■和 K 表示这两个坐标变童.把它们看成是平面上的函数时，它 
们是贝尔函数，并且如果一个概率测度 P 定义在由 R 2 中所有博雷尔集构成的 * r 
代数上，则分布函数 P{X < a :} 和 P{Y ^ y ) 存在. 它们在两个轴上诱导出两个测 
度，我们称之为边缘分布（或投影).在这种描述中，平面作为基本的概念出现，但 
相反的程序往往是更自然.例如，当我们谈及两个具有给定的分布的独立随机变贵 
时,两个边缘分布是基本概念，而平面上的概率是按照•乘积法则”由它们导出的. 
这个程序在一般情况下并不比在平面的情况下更复杂. 

于是我们考虑任意两个概率空间，即已给定两个样本空间和 CW , 由 £0) 
的某些集合构成的 a 代数和由 CW 的某些集合构成的 ( T 代数 UW , 以及分 
别定义在和11 (2 > 上的概率测度 P (« 和 P 组合乘积是所有序对 
构成的集，其中: cW 是 c ： W 中 的点. 在这个乘积空间的集合中，我们考 
虑“矩形”，即集的组合乘积（岸 1 对这种形式的集，我们希望用 
乘积法则 

P {(>1 ⑴，= P ⑴{ J 4 ⑴ } PW {4( 2 >} (6.1) 

来定义其概率.所有可以写成有限个不相交的矩形的并集的集合构成一个代数 Ho , 
(6.1) 式在 Uo 上唯一地确定一个可数可加集函数.因此，由扩张定理，在包含所有 
矩形的最小 a 代数上存在唯一的一个概牟測度 P ， 使得矩形的 板芈由 (6.1) 式给出. 
我们将用 il ⑴ xilW 表示这个包含所有矩形的最小 <r 代教，并称涮度 P 为乘积測 
度. 

当然，可以在乘积空间上定义其他的概率，例如通过条件概率来定义概率.在任 
何情况下，基本的 tr 代数 U 至少应和 xUW —样大，很少需要讨论比 W 1 ) xil ( 2 > 
更大的 a 代数.当基本代数 U 由 U = xiX (2) 给出时，下面的关于随机变童的讨 
论是正确的. 
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随机变董（可测函数）的概念是相对于基本代数而言的.在乘积空间的构造中， 
我们必须区别乘积空间中的随机变量与 ew 和办 2) 中的随机变童.幸好这3类随 
机变量之间的关系是非常简单的.如果 U 和 V 分别是和中的随机变童，那 
么我们在乘积空间中考虑这样一个函数叫它在点 (* (1 ), ar (2 )) 上取值 

w(x^\x^) = u(x^) • v(x^). (6.2) 

我们来证明，來积空间 ( C < 1 ),€< 2 )) 中的随机变 f 类是这样的取有限 值的* 敷类，使 
得这函数类包含形如 (6.2) 式的*數的所有线性组合且在点态极限下是封闭的. 

首先，很显然，即使把 (6.2) 式右边的每个因子看成是乘积空间中的函数时， 
它们也是随机变量.由此推出 u » 是随机变埴，因此 （< E (1 )， C (2 )) 中的随机变撤类至 
少应像上面所断言的那样广泛.另一方面，随机变量形成这样的最小函数类，使得 
这函数类包含矩形的示性函数的所有线性组合且在点态极限下是封闭的.这种指示 
函数可以写成 (6.2) 式的形式，因而随机变激类不可能比上面所断言的类大. 

两个带有概率测度 F 和 G 的空间 R m 和 R " 的乘积这一特殊情形，曾间接地 
出现在关干累次积分的富比尼定理 （2.11) 中.我们现在可以给出一个不局限于 IT 
中的更一般的定理. 

关于乘积测度的富比尼定理对于任意的贝尔*教 u , u 关于乘积測度的积分等于 
(2.11) 中的累次积分 • 

(当然积分可以是发散的.对于简单函数，定理是显然的，一般的情形可利用我 
们以前多次使用过的逼近方法推出 •） 向具有3个或更多因子的乘积空间的推广是 
显然的，我们就不再叙述了. 

我们现在讨论无穷随机变量序列.我们在第1卷中讨论无穷贝努利试验序列、 
随机游动、循环事件时曾遇到过这样的序列，在第3章中讨论正态随机过程时也遇 
到过这样的 序列. 当无限多个变贵都定义在同一概率空间上时，没有多少东西值得 
讨论.例如，具有正态分布的实直线是一个概率空间， { ainnx } 就是其上的一个无 
穷随机变 M 序列.我们这里关心的是需要通过随机变童来定义概率的情形.更确切 
地说,我们的问题如下. 

令 R °° 是这样一个空间，其中的点是无穷实数序列（0^,12,… )( 即是实直 
线的可数组合乘积).我们用 X „ 表示第 r » 个坐标变量（即 X „ 是 R ~ 中一个这样的 
函数，它在点 a : = (3^,12, …）上取值 ；!：„)• 假设我们巳知 X 1 ( X 1 , X 2 ), ( X ^ Xi ^ s ), ■■- 
的概率分布，希望在 R °° 中定义一个适当的概率测度.不用说，给定的分布在下列 
意义上必须是相 容的； ( X ir --, X n ) 的分布是 （ A ，…， X „ +1 ) 的边缘分布，等等. 

现在我们正式定义“由有限多次试验的结果决定的事件”这一直观概念.设 
A 是中的一个集，我们约定，当且仅当存在 IT 中的一个集 A •，使得 x = 
( xi , 属于>1的充要条件是 ( x u ---, x r ) 属于 A 时，称4只依賴于前 r 个坐 
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标.概率中的标准情 况是： 已知这样的集的概率，我们面临的问题是把定义域扩大. 
我们不加证明地给岀 A . N . 科尔莫戈罗夫在他的概率论经典公理基础 （1933) 中（在 
稍广泛的情况下）推导出的基本定理.这一定理促进了现代测度论的发展. 

定理1 …的一个相容概牟分布族，可以难一地扩张为 

R °° 中这样的最小 cr 代数 II 上的一个概牟測度，使得这个代數包含所有仅依赖于 
有限多个坐标的集合 .® 

重要的是，所有的概率都是从有限维集合出发通过逐次取极限而定义的 . U 中 
的每个集合 A 可以在下列意义上用有限维集合来逼近.给定一个 e > 0,存在一个 
n 和一个只依赖于前 n 个坐标的集合使得 

P { i 4 - AfVln } < £， P { A n - < €. (6.3) 


换句话说，属于4或但不同时厲于它们二者的点所成的集合的概率小于 2 e . 因 


此，可以选择乂„,使得 


P { A „}^ P { A }. 


(6-4) 


有了定理1,我们就可以谈及具有任意给定分布的相互独立的无穷随机变世序 
列了. 事实上，在第1卷中已出现过这样的序列，但那时我们必须小心地用特殊的 
取极限方法来定义概率，而定理1为我们提供了合乎需要的行动自由.这点可以用 
下列两个分别属于 A . N . 科尔莫戈罗夫 (1933) 以及休伊特 （ E . Hewitt ) 和萨维奇 （ L . 
J . Savage )(1955) 的重要定理加以充分说明.它们对于概率论证是典型的，而且在许 
多情况下起着中心的作用. 

定理2 (足事件的 （M 律）设变 f 是相互独立的，且对每个 r », 事件4与 

X u "' X n 独立，®則或者 P{>1} = 0 或者 PM} = 1. 

证从原则上讲，诸变 M X * 可以定义在一个任意的概率空间中，但它们把这个空 
间映射到以它们为坐标变 M 的乘积空间 R °° 中.利用 (6.3) 中所用的记号， 集合災 
与>1„是独立的，于是第一个不等式蕴含 P { A }~ P { A } P { A ,} < c . 因此， P { A } = 
P 2 { A }. ► 

例 （ a ) 级数 Y , X n 以概率 0 或 1 收敛.由所有使 IimsupX n = oo 的点所成的集 
合的概率或者是0,或者是 1. ► 

定理 3 (对称 事件的 ( M 律） 假设请变* Xfc 是相互独立的，并且具有相同的分布， 
如果集合4在坐标的有限置换下是不变的®,那么或者 P{>1} = 0, 或者 = 

①这个定理也适用于 M 部18空间的乘积；例如，变董可以解释为《机向量 （ RT 中的点). 

® 更碗切地说， A 与用 X U -..， X „ 定义的毎个亊件是独立的.换句话说， A 的指示函败是一个与 
x u -, x „ 独立的随机变*. 

® 更确切地说，如果 （ oi , a 2 ，…）是 yl 中的点， TM 和 n 2 是任意两个整数，那么假设 A 也包含通过 
把和 o „ 3 对换并让其他坐标保持不变而得到的点.这个条件可自动地扩张到涉及 fc 个坐标的 

置换 上去. 
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证 与在上一定理的证明中一样，我们把 A 作为坐标变量，并利用 (6.3) 中所出 
现的集合颠倒前 2 n 个坐标变量的次序，并保持其他的变量不变，我们就可从 
An 得到一个集合，记为根据假设，在 （6.3) 中把 换为 B „ 时不等式仍成 
立.由此推出，所有属于 A 或 A n r\B n 但不同时属于它们二者的点构成的集合的 
概率 < 4 e , 因此 

P { 爪 riBn } — P{A}. (6.5) 

因为只依赖于前 n 个坐标，所以只依赖于编号为 n + 1，…, 2 n 的坐标.因 
此， 人和乳 是独立的，由 (6.5) 式我们又得到了结论 P{A) = P 2 {A}. ► 

例 （ b ) 设= A +…+ X „, 并令 A 是事件 { S „ € 了 i . o .}, 其中 J 是直线上一 
个任意区间，那么4在有限 * 换下是不 变的. 决于记号的意义见 4_1 节例 （ a ).] ► 

4.7 零集和完备化 

概率为0的集合通常是可以忽略的，两个只在这样一个零集上不相等的随机 
变量 “在实际上是相同的”.较正式地，我们称它们是等价的.这就是说，如果在一 
个零集上改变一随机变 tt 的定义，则所有的概率关系保持不变，因此我们允许一个 
随机变童在一零集上无定义.一个典型的例子是循环事件第一次出现的 时刻： 它以 
概率1为一个数，但以概率0保持不确定（或称为 00). 因此，我们经常讨论的是等 
价随机变童类，而不是单个的变 M , 但通常最简申-的办法是选择一个合适的代表而 
不讨论等价类. 

零集导致了我们的概率结构中唯一的与直观不相符的地方.在所有的概率空 
间中，情况是相同的，但只描述直线上的情形就行了.按照我们的概率结构，概率 
只对博雷尔集才有定义，一般地一个博雷尔集包含许多不是博雷尔集的子集合.因 
而，零集可能包含没有定义概率的集合，这与零集的每个子集还是零集这个自然的 
期望不符.这种不一致不会导致严重后果，而且很容易把这种不一致消除掉.事实 
上，假设我们引入一个 公设： 如果 >1 C S 且 P { S } = 0, 則 P{A) = 0. 因此，我们 
应把所有博雷尔集构成的^代数 il (至少）扩大为包含 U 的所有集合和所有零集的 
子集合的最小 a 代数 1 U . 直接的描述 如下： 一集合4属于叫的充要条件，是它与 
某个博雷尔集，只相差一个零集®.只要令 P {^} = P{A 0 }, 就可以把定义域从 ll 
扩大到认.显然，这种定义是唯一的且导出了叫的一个完全可加测度.按照这种 
方法，我们得到了一个满足我们的公设的概率空间，且在此空间中博雷尔集的概率 
保持不变. 

①更确切地说，要求 A — 与— 4门>1 0 包含在一个零集中. 
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我们称这样描述的构造为（一个给定概率空间的) 勒贝格完备化. 在只与一个基 
本的概率分布有关的问题中，这种完备化是很自然的.因此， R 1 中区间的长度通常 
被完备化一个不仅仅局限于博雷尔集之上的勒贝格测度.但是当我们讨论分布族时 
(例如讨论带有不确定的概率 P 的无限伯努利试验序列时)，完备化是困难的.事实 
上，山依赖于基本分布，因此当概率改变时，关于山的随机变量可能就不再是随 
机变量了. 

例设 ••是 R 1 中的一列点，分别具有概率 Pl , P 2, …，其中1>^ = 1.{巧} 
的余集的概率为0,因而山包含 R 1 中的所有集合.于是毎个有界函数 u 是期望为 
EPkn ( a k ) 的随机变 M , 但当基本分布不是离散分布时，讨论“任意函数”将是危 
险的. ► 




第 5 章 R ： 中的概率分布 

本章讨论 r 维空间 IT 中的概率 分布. 从概念上讲，这个概念是以上一章简单 
讨论过的积分理论为基础的，但是事实上，为了理解本章的内容，并不需要什么髙 
深的知识，因为这里的概念和公式在直观上都很接近于我们在第1卷和本卷前3 
聿中所遇到的概念和公式. 

(与离散样本空间相比较）本章的新颖之处是，并不是毎个集合都有概率，并不 
是每个函数都可作为随机变 M. 幸好这种理论上的复杂化在实际中是不太显著的， 
因为我们可以分别从区间和连续函数出发，把注意力限制到可以由它们经过初等 
运算和（可能无穷多次）取极限得到的集合和函数 上面. 这就确定了博雷尔集类和 
贝尔函 数类. 对事实而不对逻辑关系感兴趣的读者不必为精确的定义（巳在第 4 章 
给出） 烦恼. 他们应依靠他们的直观并假设所有的集合和函数都是“合适”的.定理 
非常简单®,要理解它们只要有初等微积分的知识就够了. 在把集合和函数二词作 
为博雷尔集和 W 尔函數的缩写的约定下， 推导是严格的. 

初次阅读应限于 5.1 节 〜 5.4 节和 5.9 节 . 5.5 节 〜 5.8 节包含必要时可参考的 
工具和不 等式. 最后几节充分地讨论了条件分布和条件期望的理论，这些结果仅在 
6.11 节和 7.9 节中讨论鞅时偶然用到. 

5.1 分布与期望 

术语随机变量的即使最简单的使用，也可能要间接引用到一个复杂的概率空 
间或一个复杂的试验.例如，一个理论模型也许包含 10 28 个质点的位置和速度，但 
我们把注意力集中于温度和能 M 上.这两个随机变董把原来的样本空间映射到平面 
R 2 内，而且它们带有原来的概率分布.实际上，我们讨论的是一个二维问埋，原先 
的样本空间在背景上模糊地呈现 出来. 因此，有限维欧几里得空间 R r 是最重要的 
样本空间，我们转向对适当的概率分布作系统的研究 • 

我们从直线 R 1 开始. 用^和 a，6 表示由 a<z <6 和彡6定义的区 

①应该知道，这种简化不能通过任何*制于使用连续函败或任一其他种类的“合适”函败的理论达到. 
例如，在 2.8 节 (8.3) 中我们用一个无穷级 ft 来定义一个 密度# 建立 p 为合适的条件是一件乏味 
且无*义的事，但在筒单的情形下公式是 ft 然的.贝尔函数的利用相当于含*的“一般地成立”的 
代 用词. ——顺便提一句，必须限制于贝尔函数的少败几个场合将另外#出. 5.8 节 （ b ) 中的凸 a 
数理论就是一个例子. 
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间.（不排除闭区间缩小为一点的极限情形 .） 我们将把半开区间表示为3和 
在一维中，所有的随机变董都是坐标变量 A •(即在点 I 的值为 re 的函数）的函数.因 
此，所有的概率可用下列分布函数表示 | 


F(x) = P{X < x), —oo <x<oo. (1.1) 

特别， / = M 的概率为 P {/} = F(b) - F(a). 当我们计论变化着的分布时，灵活的 
标准记号 P { } 是不适用的.再引入一个新字母是不经济的，表示对 F 的依赖性 
的记号 Pf{ } 又太 笨拙. 最简单的是 对点* 教 (1.1) 和相应的区间函数利用同一 
个字母 F , 我们用 F {/} 来代替 P {/}. 换句话说，我们用大括号表示 F{A } 中的自 
变量是一个区间或集合， F 作为一个区间函数（或测度）出现.当用小括号时， F(a) 
中的自变贵是一个点•点函数 ) 与区间函数 } 之间的关系可用下式表示： 

F(x) = F{^b} = F(b) - F ( o ). (1.2) 

实际上，点函数 POe ) 的概念是多余的，只是有利于解析表示和图像表示.原始的概 
念是对区间賦概.我们称点函数尸 （） 为区间函数 F { } 的分布函數•记号 F () 
和 F { } 指的是同一个内容，当提及“概率分布 F 55 时不会产生混淆.我们应习惯 
于借助于区间函数或测度进行思考，而仅在作图像描述时才利用分布函数 .® 

定义称直线上的一个点函數 F 为一个分布而數，如果 
⑴ F 是不減的，即 a < 6违含 F ( a )< F (6); 

( ii ) F 是右连埃的，②即尸⑷= F{a+)； 

( iii ) F(—oo) = 0, F ( oo ) < oo . 

F 是一个概芈分布*数，如果它是一个分布函數且 F ( oo ) = 1. 此外，称 F 是亏损 
的，如果 f(c») < 1. 

我们着手来证明，毎个分布函数都导致一种对直线上所有集合的賦概.第一步 
是对区间賦概.因为 F 是单调的，所以对每一点 a 都存在一个左极限 F ( o -). 我们 
用下列式子定义一个区间函数 F {/}, 

F { a , 6 } = F(b) — F ( a —), = F(b—) — F(a), 

F { o ,6} = F (6) - F ( a ), F { o ,6} = F(b~) - F ( a -). 

①使用记号时要特別小心对于入门书似乎是可取的，但是我们希望读者不*沉迷于这种前后的一致 
性.应敢于不加区别地写出 f ( j ) 和 F (*>, 结果不会引起《淆，幸好在最奸的数学书中同 一 s 上的 
同一记号（特别是1和 =) 表示不同的意义是很常见的. 

® K 通常一样.我们用 /(»+) 表示当: t 从 a 的右边趋于 a 时/( I )的极限（如果它存在的话).用 
/(oo) 表示当 X — oo 时 f ( x ) 的极限.对于 /(a—) 和 /(-oo) 可作类似的解释.这个记号可以搬 
到髙维空间中. 
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对于缩小成一点的区间 a ^ a , F { a ^} = F ⑷- F ( a -), 它是 F 在 a 点的跳跃.（不 
久将看出， F 是“几乎处处”连续的 . > 

为了证明对区间的賦值 (1.3) 满足概率论的要求，我们来证明一个简单的引理 
(读者可以把它作为一个直观上很明显的结论而承认它). 

引理1 (可數可加性).如果一个区间/是可数多个不相交区问 h , I 2 ,- - 的并集， 
那么 

F { I } = SF { J k }. (1.4) 

证在 J = a ，6, A = a ^ al , I 2 = ai , a ■■■, /„ = 的特殊情形下，结论是 

显然的. / = M 的最一般的有限分划可以通过把 端点办 从一个子区间重新分配给 
另一个子区间而得到，从而可加性法则 （1.4) 对于有限分划是成立的. 

在考虑无限多个区间 /* 的情形时，只要假设/是闭区间就行了.由给定的分 
布函数 F 的右连续性可知，对于预先给定的 e > 0,可以找到一个包含4的开区 
间，使得0 < F { I *} - e • 2-* •因为 J 存在一个有 限覆盖 <,•••，<, 

所以 

^^/a + .-. + FUnJ + e , (1.5) 

于是 

(1-6) 

但是相反的不等式也成立，因为对于每个 n , 都存在一个包含 /!,•••,/„ 的 J 的有 
限分划.这就完成了证明. ► 

如同在 4.2 节中所说明的那样，现在可以对每个由有限多个或可数多个不相交 
区间组成的 集合土 定义 


尸⑷ = E F W . (1-7) 

直观导致我们希望每个集合都可用这样的区间的并集来通近，测度论证实了这个 
看法是正确的_®利用自然的逼近和取极限的办法，可以把 P 的定义扩展到所有的 
集合上，并保持可数可加性 （1.7). 这种扩展是唯一的，所得到的賦值被称为一个概 
率分布或概率测度. 

关于术语的注在文献中，分布一词以各种意义被自由地应用.因此，这里应规定 
一下我们将坚持使用的用法. 


①应记住如下的约定，集合和函数二词是博雷尔集和贝尔函败的®写. 
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一个概率分布或概芈測度，是一个对服从可数可加性条件 (1.7) 和正规化条件 
F{-6o,oo} = 1 的集合賦值 F{A} ^ 0. 更一般的测度（或质量分布）可以通过去掉 
正规化条件来 定义； 勒贝格测度（或普通的长度）是一个最著名的例子. 

与第1卷的循环事件理论一样，我们有时必须讨论对全直线賦予总质 M p = 
F{-oo,oo} <1 的测度.这种测度称为具有亏值 1 - p 的亏损极率測度.为了使文体 
清晰，也是为了强调，我们有时谈及正常概率分布，但此外形容词“正常”两字是 
多余的. 

测度 m { A } 的自变量是一个集合，用大括号表示.对于毎个有界测度 m , 有一 
个分布函数，即用 m ( a 0 = m {=55^} 定义的点函数与之对应.我们用同一字母表 
示它，把自变 M 写在小括号内.同一字母的这两种用法不会引起混淆，同样术语分 
布既可看成是概率分布的缩写，也可以看成是它的分布函数的缩写. 

在第1卷第9聿中，我们把随机变量定义为样本空间中的实函数，我们将沿用 
这个 用法. 当把直线作为样本空间时，每个实函数都是一个随机变童.坐标变量 X 
是基本变 M , 所有其他的随机变量都可表示为它的函数_随机变址 u 的分布函数被 
定义为 P {«( A ： Kx }, 可以用坐标变童 X 的分布 F 来 表示. 例如， X 3 的分布函数 
为(尸作). 

我们称函数《为一个简单函數，如果它只取可数多个值〜,^，….如果>1„表 
示使 u 等于 a „ 的点的集合，那么只要下列級數绝对收釗，我们就把期望五 ( u ) 定义 
为 

E ( u ) = ^2 a kF{Ak}- (1.8) 

在相反的情形下，我们称 u 关于 F 是不可 积的. 于是，为使 u 有期望，当且仅当 
E (| u |) 存在.从定义 （1.8) 出发，我们对任意有界函数 u 定义期望如下.选取 e > 0, 
用 A 表示使得 (n - l)e < u ( a :) 彡 ne 的点 i 的集合.对于 E ( u ) 的任一合理的定义， 
我们应有 

E(n - l)e. F{i4„} ^ E(u) ^^ne- F{i4„}. (1.9) 

(两端的项表示两上满足 = 6 的近似简单函数和2；的期望 •） 
由于假设 u 是有界的，所以 (1.9) 式中的两上级数只包含有限多个非零项，它们的 
差等于 eJ：F{An} = e •把 e 换为把 （1.9) 式中的第一项增大，最后一项减小. 
因此不难看出，当 e — 0 时， （1.9) 式中两端的两个项趋于同一个极限，我们把这个 
极限定义为 E ( u ). 对于无界的 u , 只要 (1.9) 式中的两个级数绝对收敛，则可用同 
样的手续定义 E («), 否则 E («) 仍无定义 • 

我们称用这种简单方法定义的期望为 u 关于 F 的勒贝格-斯蒂尔切斯积分. 
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当需要强调期望对 F 的依赖性时，积分记号更可取，我们把它写成另一种形式 

E(u) = J^u(x)F{dx}, (1-10) 

其中 a ： 作为哑变量出现.除了少数几个场合外，我们将只讨论逐段连续的或单调的 
被积函数，这样就成了有限多个区间的并集.于是， (1.9) 式中的两个和式是 
在普通积分的初等定义中所用的大和与小和的重排.一般的勒贝格斯蒂尔切斯积 
分具有积分的基本性质，还有一个附加的优点，即更容易进行形式上的运算和取极 
限.我们把期望的应用局限于如此简单的情形，以致于为了理解每个单个的步骤不 
箔要知道一般的理论.对理论背岽和基本事实感兴趣的读者可以参阅第4章. 

例 （ a ) 设 F 是对点…賦予质…的离散 分布. 于是当级数收敛 
时，显然有 E («) = E «( ok ) P *- 这与第1卷第9章中的定义一致. 

例 （ b ) 对于由一个连续密度定义的分布，只要下列积分绝对收敛，就有 

E («) = J u(x)f(x)dx. ( 1 . 11 ) 

关于密度的一般概念见 5.3 节. 

向高维空间的推广 可用几句话来 推述. 在 R 2 中， 点: r 是一对实数 , z = ( Xl ,x 2 ). 
我们将把不等式按各个坐标进行解释， ® 于是 a < b 表示 ai < h 和 a 2 < 知(或者 
“ a 位于6的西麻 ’)• 这只导出偏序，即点 a 和6不必满足两个关系式 a<b^,a^b 
中的任 一个. 我们对于由那4种可能类型的双向不等式 a<x<b 等定义的集合， 
仍用“区间” 一词.它们是平行于坐标轴的矩形，可以退化为线段或点. 

唯一的新特征是 | 满足 a < 6 < c 的二维区间3^，不是3和 P 的并集.对 
应于一个对区间/賦予值 F {/} 的区间函数，我们可以引入它的分布函数，与前面 
—样，把它定义为 F(x) = 但是，一个用这个分布函数表示的 

公式要涉及区间的所有4个顶点.事实上 1 ^虑那两个平行于巧轴并以矩形3 
的边为底的无穷带形，立即可以 看出， F { M } 由下列所谓的 混合差 给出， 

F { a , 6 } = F(bi , 62 ) - ^( ai , *> 2 ) - F ( 6i , o 2 ) + F ( ai , o 2 ). (1.12) 

对于分布函数来说，右边是非 负的. 这菹含 F ( x 1 ,* 2 ) 单调地依 tt 于 A 和吻，但是 
这样的单调性不能保证 (1.12) 的 正性. （见习题 4.) 

显然，高维空间中分布函数的使用价值是很有限的.要不是为了与 R 1 中类似， 
我们可以把所有的讨论限制到区间函数上.在形式上，只要把单调性条件⑴换为 


® 这个概念是在 3.5 节中引进的. 



116 第 5 幸 R F 中的概丰分布 


以下条件，即对于 a < 6, (1.12) 中的混合差是非负的，那么 R 1 中分布函数的 
定义就可搬到 R 2 上. 与在 (1.3) 中一样，这样的分布函数也可以导出一个区间函 
数，所不同的是在这里混合差起着 R 1 中的简单差的作用.引理1和它的证明仍然 
成立 .® 

有时把期望的•个简单的，但在概念上很重要的性质认为是不证自明的.两个坐标变 
量的任一函数 t *( X )= u ( X ,, X 2 ) 都是-个随机变董，因此它有一个分布函数 G . 现在可以 
用两种方法定义期望 E ( t «( X )), 即可定义为关于平面上给定概率的积分，也可以 
用 u 的分布函数 G 定义为 

E («) = J +C °yG{dy}. (1.13) 

根据用 4.4 节 （4.3)® 近似和表达的上述积分的定义，这两个定义是等价的.需要注意的是， 
虽然随机变量 Z 既可以看作为原先的概率空间6中的函数，也可以看作为一个通过6的 
适当映射所得到的空间中的函数，低是它的期望（如果它存在的话）却有一个固有的含义1 
特别，么本身把6映到直线上.在宜线上，它变为坐标变 S . 

从现在起， R 1 中的体系和 R 2 中的体系躭没有什么区别了.特别，期望的定义 
与维数无关. 

把前面的结果总结一下就有 | 任一 分布兩數都在中的博當尔集组成的 cr 
代数上导出一个概牟測度， 从而定义了一个概率空间.这可以非正式地重新叙述 
如下： 我们证明了，与在密度的情形一样，离散样本空间的概率体系不用作任何 
形式上的改变就可搬过来，从而说明前3章所用的概率术语是有道 理的. 当我们谈 
到 r 个随机变 M &，…， X r 时，我们认为它们是定义在同一概率空间上的，从而 
( Xj , …， X r ) 的联合分布存在•于是，我们可以自由地把 X fc 解释为样本空间 R ••中 
的坐标变童 • 

几乎可以不加说明而继续使用像边 缘分布 (见 3.1 节和第1卷 9.1 节）或独立变 
M 等术语.关于这些变 M 的基本亊实和在离散情形中一样. 

⑴ A •和 F 是具有（一维)分布 F 和 G 的独立随机变童，是指（ X , y ) 的联合分 
布函数由乘积 F(xi)F(x 2 ) 给出. 这个陈述可以适用于一给定概率空间中的两个变 
世，也可以作为下列陈述的 缩写： 我们引进一个以 A ■和 y 为坐标变量的平面，并 
用乘积法则来定义概率.这个说明也同样适用于随机变贵对或随机变量的三元组， 
等等. 

①证明利用了下面的亭实I在一维区间的有隊划分中，子区间按从左 SI 右的自然*序出现.一个同样 
整齐的样列刻划了二维区闾的棋盘式划分的特征，即划分成 mn 个子区间，这些子区间是通 
过单独细分^6的两边并过所有分点作坐标袖 的平行 线而得到的.对于这样的供盘式划分，有限 
可加性的证明不需要改变.对于任一划分.》有一个相应的棋盘式的加细.从有»划分到可数划分 
的过渡与维败无关. 

® 一 个特殊情形包含在第1卷 9.2 节的定理1中. 
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( ii ) 如果 m 元组（ X :，…， X „) 与 n 元组⑺，…, y „) 独立，那么（对于任意一 
对函数 u 和 v ) u ( X x , …， &) 与 v ( yi ， …， K ) 也是独立的. 

( iii ) 如果； (:和 y 独立，那么当 x 和 y 的期望存在时（即当积分绝对收敛时)， 
E ( xy ) = E ( x ) E ( y ). 

下列简单结果是非常有用的. 

引理2 —个极牟分布可由所有在某有限区间外等于聿的连续函數 U 的斯望 E ( u ) 

唯一确定. 

证设/是一个有限开区间， r 是一个在/中为正而在/外等于零的连续函数，那 
么在每个点 xe /±, -1. 因而 E (奶 J ) -* F {/}. 于是，对于所有的开区 

间，给定的那一类连续函数的期望唯一地确定了值 F { J }, 这些值唯一地确定了 

► 

注 I ® 里斯表 示定理在上一引理中，期望是用一个给定的概率分布定义的.我们通常 
(例如在 7.3 节的矩问题中）从一个给定的泛函，即从一个对某些函数的賦值 E ( u ) 出发.我 
们问^是否存在一个概率分布使得 

E ( u ) = J «( a :) F { da :}. (1.14) 

可以证明，3个明显的必要条件也是充分的. 

定理 飯设对于每一个在某有限区间外等于零的 连蛾* 數 U , 都有一个具有下列性质的数 
E ( u ) 与之对应，⑴此泛*是戏性的，即对于所有的线性组合， 

E ( ci«i + ca « a ) = ciE ( ui ) + C2E ( u2 ); 

( ii ) 它是正的，即 ti > 0疏含 E ⑻彡0; ( iii ) 它的范教等于1,即0 < u < 1蘊含 E ( n ) < 1, 
但对每个《 > 0,存在一个 u , 使得0 < u < 1且 

E ( u ) > 1 — «■ 

那么存在嘈一的一个板牟分布 _F 使 (1.14) 式成立. 

证对任意的 t 和/» > 0, 用灸, h 表示 cc 的满足下列条件的连续函败，它当 a : 矣 t 时等于 
1,当 * > * + 时等于零，在中间的区间 t ^ x^t + h 上是线性的.这个函数在无穷远点 
不等于零，但是我们可以利用简单的通近来定义 E ( zt , h ). 选取函数 | u „| < 1,使 E («„) 有 
定义且对于 W 《 n , u „(*) = 如果 m > n , 那么差 Um - Un 在区间 ^ nTn 内恒等于 

零，由 E 的范数等于1这个事实可知， E («„- 1 ^)- 0 . 由此推出， E ( n „) 收敛于一个有限 
极限，这个极限显然与〜的选择 无关. 因此，定义 E ( z «, h ) = limE ( u „) 是合理的.容易看 
出，即使在这个扩大了的定义域中，泛函 E 也具有定理中所要求的3个性质. 

①这个注讨论一个从*念上讲很有意思的踝顯，但是我们在下文中用不着它.关于另外一种方法见 
4.5 节. 
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现在令 F h ( t ) = E(*t. h ). 对于固定的 A, 这是一个单调函数，它从0变到 1. 它是连续 
的，因为当0 < J < ft 时，差 2,+i.h ~Zt, h 的图形是一^髙为 J/fc 的三角形， 因此凡 的差商 
以 1/fc 为界.当 h — 0 时，函数巧单调减少趋于一个极限，我们把这个极限记为 F. 我们 
来证明， F 是一^概率分布.显然， F 是单调的，并且 F(-oo) = 0. 此外， F ( t )^ F h ( t - h ), 
这蘊含 F(oo) = 1. 还需要证明 F 是右连续的.对于给定的 t 和 e > 0,选取这样小的 h, 使 
得 F ( t )> Fh(«) _ e. 由凡的连续性知道，对于充分小的么有 

F(t)> F h (t) - t > F h (t + S)-2e^F(t + S)-2e, 

这就证明了右连续性. 

设《是-叶在有限区间^外等于零的连续 函数. 取 asooStu <•••<(»„ = b, 使 
得在每个子区间 &k-i,a k 内， u 的振 椹小于 e. 如果 /i 比这些区间的长度中的最小者还小， 
那么 

- *«.*-, ih ) (1_15) 

是一个逐段线性函数，其顶点在 a * 和处 + h 上. 因为 = «h(o fc ), 所以 |ii - t* h K 2e. 
因此 |E(u) - E(« fc )| < 2«. 但是当 h — 0 时， 

E(u h 卜矣 uCoO^Ofc-i-Ofc}, (1.16) 

这个和式与 (1.14) 式中的积分之差小于 e. 于是 (114) 式的两边之差小于3«,因此 (1.14) 
式成立. 

注 n 关于独立性和相关性统计相关理论可以追«到理论尚无法定形、随机独立性概念 
不可避免地要带有神秘色彩的时候.那时人们知道，两个期望为零的有界随机变量的独立 
性瘟含 E(xy) = 0,但是在一开始，人们认为这个条件也是 a •和 y 独立的充分条件.后来 
人们发现，事实并非如此，这个发现导致人们去寻求使不相关蕴含随机独立性的条件•正 
如经常发生的那样，这个问题的历史和部分结果的光辉很容易掩盖下面的事实，即用现代 
方法解决这个问题是非常简单的.下列定理包括了文献中用种种困难的方法证明过的各种 
结果. 

定理 为使随机变量和 F 独立，当且仅当对于所有在某有限区间外等于零的连续*數 
和 V ,都有 


E(ti(X) - t>(y)) = E(«(X)) - E(v(K)). (1.17) 

证条件的必要性是显然的.为了证明充分性，只需证明，对于每一个有界连续函数 E(tx-) 
与关于一对与 A •和 Y 有相同分布的独立变量的期望相同. (1.17) 表明，当具 
有 w(X,Y) = u(X)v(X) 的形式时，上述结论 成立. 每个有界连续函数 w 都可用形如 
Ec fc «*(x) Wfc (y) 的线性组合来一致通近®.取极限就可看出，这个结论对于任意的有界连 
续函数 W 成立. ► 


①见 8.10 节中的題 10. 
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5.2 预备知识 

本节主要对与 R 1 中的概率分布有关的熟知的明显的东西引进术语 • 

与在离散变景的情形一样，只要 E ( X fc ) 存在，我们就把它定义为随机变量 X 
的 fc 阶矩.所谓 E(X k ) 存在，是指积分 

E ( X *) = J°° x fc F { da :} (2.1) 

绝对收敛. 因此， 为使 E ( X fc ) 存在，当且仅当 E (| X fc |) < oo . 我们称最后这个董为 
X的 k 阶 绝对矩 (对非整数 fc > 0也有定义).因为当0 < a < fe 时，+ 1， 
所以6阶绝对矩的存在性蓮含所有阶为 a < 6的绝对矩的存在性. 

如果 X 的期望为 m , 那么我们称 X-m 的二阶矩为 X 的方差， 

Vax(X) = E((X - m ) 2 ) = E ( X 2 ) - m 2 . (2.2) 

它的性质和在离散情形的性质 一样. 特别，如果 a ■和 y 独立， 那么当 x 和 y 的方 
差存在时， 

Var(X + Y) = Wai(X) + Var ( y ). (2.3) 

[我们称两个满足 (2.3) 的变憊是不相关的.在第1卷第9章中曾经证明过，两 
个相依 变憊可 以是不相关的 .j 

我们以前常常把随机变 M X 换为嘴减变贵” 


其中 m = E(X), a 2 = Var ( X ). 物理学家称； f* 是“用无因次单位表示的”.更一般 
地说，从 X 变到其中 a >0) 相当于原点和贵度单位的 变化. 这个新变贵 
的分布函数为 F(ax + /3). 在许多情况下，我们实际上讨论的是这种形式的分布的 
全体，而不是单个的代表.因此，为了方便起见，我们引入 •- 
定义1 我们称 R 1 中的两个分布巧和朽是同一类型的①，如果 F 3 ( x ) = Fi { ax + 
0 ), 其中 a>0. 我们把 a 称为尺度因子， 把; 3称为中心（或位直）常数. 

有了这个定义，我们就可以使用像嘴样规定 F 的中心，使它的期望为0” 或 
“中心常数不影响方差”这样的语句. 

①这个概念是辛炊 （Khintdiine) 引入的，他使用的是徳文术语 Klasse, 但在英文中“ a class of 
function8( 函败类)”巳有碥定的意义. 
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我们定义一个分布 F 的中位数为一个满足 ^ 1, F ( C -) < •的数 f 它未 
必是唯一确定的；如果对于区间中的所有 = 那么每个这样的 z 都 
是一个中位数.可以这样规定一个分布的中心，使得0是它的一个中位数. 

除中位数外，这些概念都可以搬到髙维中或形如 X = ( X u ---, X n ) 的随机向 
董上； 合适的向 M 记号已在 3.5 节中引入，不需要改变.现在， X 的期望是一个向 
M , 方差是一个矩阵. 

考察分布函数的图像时首先注意到的是它的不连续点和常值区间.我们经常 
需要说一点不在一常值区间中.我们引入下面的可适用于各维空间的方便术语. 
定义 2 我们称点0：是一个原子，如果它带有正 质量. 我们称它是 F 的增点，当 
且仅当对于包含 a : 的每个开区间都有 F { J }>0 时. 

我们称 分布尸 集中在集合4上，如果余集 X '的概牟 F { A '} = 0. 

我们称分布 F 是原子型的，如果它集中在它的原子组成的集合上. 

例把0^中的有理数按分母增加的次序排成一个数列…•设尸对以賦予 
概率 2 _*,那么 F 是纯原子 型的. 但是应注意，闭区间 K 中的每一点都是 F 的 
增点. 

由可数可加性 （1.7) 知，诸原子的质童之和不能超过1,从而至多 只有一 个原 
子的质贵大于^至多只有两个原子的质童大于^等等.因此可以把原子排成一 
个简单序列使相应 的质憊 减少 ， pi > pa ^ 换句话说，至多存在可 
數多个原子 • 

我们称没有原子的分布为连续 分布. 如果有原子，则用外，仍,…表示它们的 
质贵，并设 P = EP * 是它们的和•令 

Fa 0»0= p _1 51 pfc ， (2.4) 

!»(><* 

其中求和是对中的所有原子进 行的. 显然，也是一个分布函数，我们称它 
为 F 的原子型分量_如果 P = 1，那么分布尸是原于 型的. 否则就令 q = i - p ■容 
易看出， [ F - pF a ]/q = F c 是一个连续分布，因此 

F = pFa + qFc (2.5) 

是两个分布函数的线性组合，其中是一个原子型分布 ，凡 是一个连续分布•如果 
F 是原子型的，那么 （2.5) 对 p = 1和任意的 F c 成立；在没有原子的情形下， （2.5) 
对 P = 0 成立. 因此我 们有： 

若尔当 ( Jordan ) 分 解定理 每个镟年分布都是由一个原子型分布和一个连续分 
布组成的形如 （2.5) 的混合；这里 p >0, g >0 ,p + g = l . 
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在原子型分布中，有一类分布由于明显的例外而有时要妨碍简单的公式表述. 
它的成员与整值随机变董只相差一个尺度因子，但是它们是如此经常地出现，以致 
为了便于引用，需要给它们起个名称. 

定义3我们称 R 1 中的分布 F 是一个算术分布, ® 如果它集中在形如0, 土 A ，±2 A ,..- 
的点杲上.我们称具有这个性肩的最大的 A 为 F 的步长. 


5.3 密 度 

头两章讨论了 R 1 中的这样的概率分布，使得对于所有的区间（因而对于所有 
的集合)， 

F { A } = 九 < fi ( x)dx (3.1) 

第3章的分布具有同样的形式，积分是关于 IT 中的勒贝格测度（面积或体积）进 
行的.如果 （3.1) 式中的密度$集中在区间0, 1上，则 （3.1) 取形式 

F ^ = Ja (3.2) 

其中 U 表示在0, 1上的均匀 分布. 上一公式对任意的概率分布 y 都有意义，当 
= 1时，它定义一个新的概率分布 F . 在这种情形下，我们称 冰 F 炎 
于1/的密度. 

在 (3.1) 式中，测度 f ； 是无穷的，而在 (3.2) 式中 l /{^ oo , oo } = 1. 这种差别不 
是本质的，因为可以把 （3.1) 式中的积分写成一系列的形如 （3.2) 式的在有限区间 
上的积分 的和. 仅当 " 是一个概率分布或勒贝格测度（如在(3.1>式中）日寸，我们才 
利用 （3.2) 式，但下列定义是一般的. 

定义我们称分布 F 关于測度 t / 是绝对连续的，如果它具有 (3.2) 的形式.在这 
种情形下，称¥>为 F 关于 f / 的密度®. 

特殊情形（ 3 .1)(其中口是勒贝格测度）当然是最重要的，在这种情形下，我们 
称 P 是一个“普通”密度. 

我们现在引入 缩写式 

F { dar } = <p(x)U { di }. (3.3) 

①术语格点分布也许更为常用，但 ft 它的用法不一样，按照一些作者的意见，格点分布可以集中在点 
集 a， a 土 A,a±2A,. ••上，其中 a 是任意的.（按照我们的术语，在±1上具有 J* 子的二項分布是 
步长为1的算术分布，但是据另外一种 定义， 它是一步长为1的格点分布 •） 

® 在测度论中，称 V» 为尸关于 U 的拉东-尼科■迪嬅 (Radon-Nikodym) 导数. 
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这只是一个表示 (3.2) 式对所有集合成立的速写记号，其中 dx 没有什么意义.利用 
这个记号，可把 （3.1) 式缩写为 F{dx} = ^ x ) Ax . 如果 [/ 有一个普通的密度 U ，那 
么 (3.2) 式与 F{dx} = < p ( x ) u ( x ) dx 具有相同的意义 • 

例 （a) 设 f/ 是 R 1 中的一个概率分布，它的二阶矩为 m 2 . 那么 

F { dx } = — a ^ U { dx } 


是一个新的概率分布.特别，如果1/是0：!中的均匀分布，那么对于0 < * < 
1, F ( x ) = I 3 ;如果有密度 e-*(® > 0), 那么 F 是具有普通密度的 r 分 
布. 

例 （b ) 设 t/ 是一个原子型分布，它对 ai,a 2 , …賦予质量 pi,p2, …(其中 EPfc = 
1). 为使分布 F 关于1/有密度 a 当且仅当它是纯原子型分布，且它的原子在 
〜勿, …中. 如果，对~賦予质 镦办， 那么密度为 ¥»(a fc ) = &. p 在其他点上 
的值不起作用，除了在原子上以外，最好不定义¥>的值. ► 

从理论上讲， (3.2) 式中的被积函数#不是唯一确 定的； 因为如果 AT 是一个使 
得 U { N } = 0的集合，那么可以以任意方式在 W 上重新定义 p 而不影响 （3.2) 式. 
但这是唯一的一种不确定性，除了在一个聿測集上的值外，密度是呻一确定的 .® 在 
实际中，唯一的选择通常是由连续性条件支配的，因此，我们通常讲“这个”密度， 
虽然讲“一个”密度更精确. 

对 f 任一有界函数 v, 关系式 (3.3) 显然菹含® 

w(x)F{di} = t;(x)v3(x)/{di}. (3.4) 

特别地，如果 p 取0以外的有界值，那么我们可以选取I ； = > p -\ 从而得到 (3.2) 
的反演公式 

U { dx } = -^rF{dx}. (3.5) 


® 事实上，如果和列都是 F 关于{/的密皮，那么考察所有使得 v»(*)>vi(*> + « 的点 z 所成 
的集合 A 由 

=人 ifi{x)U{<ix} = ¥>i(z) (/ {da;} 

推出 U{A) = 0,因为这对于毎个 e > 0 »成立，所以我们宥出，除了一个使 U{N} = 0的集合 
W 外， V >{ x ) = 

® 对新积分感到难以理 _ 的读者应当注意.在连续密度的情形下. (3.4) 化为 热知的 积分代换法則.下 
面的在一般情形下的证明，利用了一个可适用更 • •般情形的标准论证.当 v 是简单函数时，即它 
仅取有限多个值时，公式 (3.4) I然成立.对每一个有界函败存在两个简单函数和使得 
v ^ v ^ v , v - v < c , 因此， (3.4) 对所有简单函数成立就瘇含着它在一般情形下的正确性. 




一个常用的绝对连续准则包含在测度论的一个基本定理中，我们不加证明地 
承认这个定理. 

拉东-尼科迪姆 ( Radon - Nikodym ) 定理① F 关于 t ； 是绝对连续的，当且仅当 
U { A } = 0时 

F{>1} = 0. (3.6) 

这个表达式可用下列陈述来 表达： U 零集也是 F 零集.我们给出一个重要的 
推论，虽然在本书中没有明显地用到它. 

准则 F 关于 [/是 绝对連埃的，当且仅当对于每个 e>0, 有一个 J>0, 使得对 
任意一组不相交区间 II ， …， In ， 

j2 u W<S 後含 ^F{/ fc }<e. (3.7) 

1 1 

—个重要的特殊情形是对于所有区间有 

F{r}^aU{I}. (3.8) 

于是 (3.4) 对 <5 = ^成立.容易看出，在这种情形下，有一个关于1/的密度 R 
使得 


奇异分布 # 


拉东-尼科迪姆定理的条件 (3.6) 导致我们研究绝对连续分布的极端相似物. 
定义称概牟分布 F 关于 U 是奇异的，如果它集中在一个使 U { N } = 0的臬合 
N 上. 

勒贝格测度 l /{ dx } = dr 起着一个特殊的作用，在没有进一步的限制下，“奇 
异”一词就是指关于它是奇异的.每个原子型分布关于 di 都是奇异的，但是 1.11 
节例 （ d ) 的康托尔型分布表明，在 R 1 中存在这样的连续分布，它们关于 d : c 是奇 
异的.这样的分布不易用微积分的方法进行处理，它的明显表达式实际上是不可能 
的. 因此，为了分析的目的，我们不得不选取一个可导致连续分布或原子型分布的 
框架.但是从概念上讲，奇异分布起着重要的作用，许多统计检验依赖于它的存在 
性.这种情况被奇异分布“实际上”不发生这一陈词滥调所掩盖. 

①通常称为勒贝格-尼科迪姆 （Lebesque^Nikodym) 定理.关系式 (3.6) 可以作为绝对连续性的定 
义. 在这种情形下，定理断言了密度的存在性. 

* 虽然从概念上讲奇异分布很重 S, 但在本书中 只是附 带地提一下. 
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例 （ c ) 伯努利试验 .在 1.11 节例 （ c ) 中曾经指出，可以通过把 S 和 F 分别换为1 
和0这一简单方法，把由序列 SS … F …组成的样本空间映到单位区 间上. 于是单 
位区间成了样本空间，无穷试验序列的结果可用随机变董 y = E 2- fe x fc 表示，其 
中心是 以概率 P 和 g 取值1和0的独立变量.用 f p 表示 y 的分布.对于对称的 
试验， q 是一个均勻分布，这个模型由于其简单性而引人 注目. 事实上，从概率论 
创始以来，人们就一直利用着对称伯努利试验与“在 07 T 中随机地选取一点”的等 
价性.现在根据大数定律，分布&集中在由这样的点组成的集合上，使得在它 
们的二进制展开式中数字1的频率趋于当 P # a 时，集合凡的概率为0,因为 
分布 F p 是相互奇异的； 对于 J ) / 分布&关于均匀分布 dx 是奇异的 . F p 的明 
显表达式是不适用的.因此，当$时，此模型不被普遍使用.有两点值得注意. 

第 一 ，考虑一下，如果特殊值 P = ^有特殊的意义或在应用中经常出现，那 
么将发现什么情况.我们把数的二进制表达式换成三进制展开式，并引入一个新尺 
度，使 q 和均匀分布 重合. “实际上”我们仍然只讨论绝对连续分布，但其理由在 
于所用的工具的选择，而不在于事物的本质. 

第二，硬币是否均匀可用统计学的方法进行检验.实际的必然性可以通过有限 
次试验得到.这是可能的，因为在假设 p = | 可能发生的现象，在假设 p = ^是极 
不可能发生的.沿着这条线路稍做思考就可发现，之所以能够在有限次试验后作出 
决定是由于下列 事实：凡关于 Q 是奇异的要 P / 因此，奇异分布的存在 
性对于统计学的实践是非常璽要的. 

例 （ d ) 随 机方向 • R 2 中具有随机方向的单位向 量的概 念是在 1.10 节中引进的. 
这种向 M 的分布集中在单位圆周上，因而它关于平面上的勒贝格测度（面积）是奇 
异的.有人可能说，在这种情况下，应把圆周作为样本空间，但是实际的问题有时 
使这种选择是不可能的. 

勒贝格分解定理每一个概芈分布都是一个下列形式的混合> 


F = pF, + qFac, (3.9) 

其中 P 彡 0,g 彡 0，p + g = l . 巧是一个关 于给定的測度1/奇异 的板芈 分布，化是 
一个关于 U 绝对连续的概芈分布. 

把若尔当分解式 (2.5) 应用于 F •可知，可以写成3个概率分布的混合，其 
中第1个是原子型分布，第2个是关于 U{dx} 绝对连续的分布，第3个是一个连 
续但奇异的分布. 

证为了使叙述简单，我们把使得 U { N ] = 0的集合 TV 称为 零集. 设 p 是 F{JV} 

对于所有零集 iV 的上确界.对于每个 n , 存在一个零集 AT„, 使得 F{iV n } > p -~. 

n 
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于是对余集 W 中的任一零集对于并集 N = \ JN „, 这逭含 U { N } = 
0, F { AT }= p , 因而余集 TV ' 中的任一零集^概率为 0. 

如果； )=1, 则 F 是奇异的，而 p = 0 表示 F 是绝对连续的.当 0< P <1 时， 
结论对于由下式定义的两个概率分布是正 确的： 

p - F s { A }^ F { AN }, q - F ac { A } = F { AN '}. (3.10) ► 

5.4 卷 积 

在许多数学分支中，卷积是非常有 用的. 我们必须用两种方式讨论 卷积， 一个 
是作为分布之间的运算，另一个是作为一个分布与一个连续函数之间的运算. 

为了确定起见，我们只对 R 1 中的分布进行讨论，但是利用 5.1 的向董 记号， 
诸公式与维数 无关. ® 周上的卷积 的定义可仿照 2.8 节中所述的方式给出，不需要 
说明. （更一般的卷积可以定义在任意的群上 .） 

设 F 是一个概率分布，是一个有界点函数.（在我们的应用中， p 或者是一 
个连续函数，或者是一个分布函数 •） 那么用 

«(*) = J y ) F { dy ) (4.1) 

定义一个新 函数仏 如果 F 有一个（关于 di 的）密度/，那么上式化为 

«(*) = J 咖 _ v ) f (. v ) dy . (4.2) 

定义1 一个函数 ¥> 与一个概牟分布 F 的卷积是由 (4.1) 式定义的*数.我们把 
它表示为 u = 当 F 有一 个密度 / 时，我们还可写成 „ = 

注意，项的次序是很重要的 I 符号—般说来是无意义的.另一方面， (4.2) 
对于任意可积的/和 W 即使/不是非负的）都有意义，我们在这种一般化了的意 
义上使用符号 *■ 不用说， p 的有界性只是为了简单起见而假设的，并不是必需的. 
例 （ a ) 当 F 是@中的均匀分布时， 

u (*) =a ~ 1 J (4.3) 

由此推出 u 是连续的；如果^是连续的，那么 u 有一个连续导数， 等等. 一般说 
来，《的性质比的性质好，因而卷积起一个光滑算子的作用. 

例 （ b ) 关于指数分布以及均匀分布的卷积公式[ I . 3 节 （3.6) 和 1.9 节 (9.1)] 是一 
些特殊 情形. 关于 R 3 中的例子见 3.1 节 (1.22) 和第3章的习题15 〜习题 17. ► 
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定理1 如果 <(3是一个有界连续函數，那么也是 一 个有界连续 A 數•，如 
果 V 是一个概牟分布函數，那么 U 也是一个概率分布函数. 

证如果 P 是一个有界连续函数，那么根据控制收敛定理， U ( a 0. 同 
理，¥>的右连续性蕴含《的右连续性.最后，如果从0单调增加到1,那么 U 也 
显然如此. ► 

当 P 是一个分布函数时，下列定理给出了…的一种解释. 

定理2 设 X 和 F 是具有分布 F 和 G 的独立随机变量，則 

P{X + Y ^ t } = J °° G ( t - *) F { d ®}. (4.4) 

证①取 《>0, 用7„表示区间 nfCarO + l )^, 这里 n = 0, 士 1,…，如果对于某 
个 n , X Gw , Y < t - m , 那么事件 {X + y < 0发生.前两个事件是互斥的，因 
为 A •和 K 独立，所以我们有 

P {^ + y 《 G (< - ru ) • F {/„}. (4.5) 

右端是在夂中取值 G(t - ne ) 的阶梯函数 G t 的积分.因为 G t ( y ) KG(t + e - y ), 
所以 

P{X + K ^ 0 < J + °° G(t + e - x ) F { dx }. (4.6) 

把 e 换成 - e , 利用同样的论证可得到相反的不等式.令 e — 0,我们就得到 (4.4) 
式. ► 

例 （ c ) 设 F 和 G 集中在整数0,1,2 ，… 上，用办和取表示 fc 的质贵.那么 
(4.4) 中的积分化为和 k ) p k . 这是一个当 t < 0时等于0而在每个区间 
n -\< t < n 中都为常数的 函数. 它在 t = n 上的跳跃等于 

52 1 n-kPk = 9 nPo + q n -iPi + •■• + qoPn , (4.7) 

*=o 

这与第 1 卷 11.2 节 (2 J ) 整值随机变董的卷积公式一致. ► 

上述每个定理表明，对于两个分布函数，卷积运算产生一个新的分布函数 C /. 
加法 A " + K 的变换律菹含 F*G = GirF . 一个完备的系统也许要对这种分布函数 


① （4.4) 是 4.2 节 (2.11) 苜比尼定理的一个特殊情形，定理2的逆不真I我们在 2.4 节 （e) 和 3.9 节 
的习題1中看到，在个别的情形下，公式 (4.4) 对一对相依变貴X, Y 也可能成立. 
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之间的卷积引入一个新的符号，但这 p 没有什么用处 .® 当然，我们应把1/看作 
区间函数或测度：对于每个区间/ = ^，显然有 

U { I } = [°° G{I - y } F { dy }, (4.8) 

其中，与通常一样， J - y 表示区间 a -!/,«>-»• (这个公式可以搬到任意集合上 •） 
由交换律得知， (4.8) 式中 F 和 G 的位置是可交换的. 

现在考虑3个分布 F u F 2 , F 3 . 随机变量的加法的结合律菹含（巧= 
^★( F 2 ^ F 3 ), 因而可以去掉小括号，写成 Fi - kF ^- kFa . 我们把这个总结在定理3 
和定理4中. 

定理3 在分布中，卷积运 算 ★ 满 足交换律和结合律. 

定理4 如果 G 是连埃的 （= 无原子的)，那么[/ = F - kG 也是连 埃的. 如果 G 有 
一个普通密度叭那么 r 有一个普逋密度 u , 它由 (4.1) 给出. 

证第一个断言包含在定理1中•如果#是 G 的密度，那么在区间 J 上积分 (4.1) 
就可得到 （4.8), 因而 u 确实是 (4.8) 所定义的分布1/的密度. ► 

特别，由此推出，如果 F 和 G 有密度/和 g , 那么卷积 F * G 有一个如下的 
密度 h = f*gt 

h = j f{x - y ) g ( y ) dy . (4.9) 

一般说来， A 的光滑性比/和的 都好. （见习题14.〉 

n 个具有共同分布 F 的相互独立的随机变量之和 S n = X ! + ■■■ + X n 如此经 
常地出现，以致于需要引入一个特殊的记号 • S „ 的分布是 F 与它 本身的 n 重卷机 
我们把它表示为 F "*. 因此 


F 1 * = F , F < n+1 >* = F n *- kF . (4.10) 

我们习惯上把不包含项的和式解释为 0. 为了一致起见，我们把 F 0 * 定义为集中在 
原点上的原子型分布.于是 (4.10) 对 n = 0也成立. 

①换句话说，当积分是关于测度 A 进行时，我们使用符号 A - kB . 根据 S 是点函数[知在（ 4 .1)中1 
或测度 Ito 在 （4.6) 中],这个卷积也是点函数成*度.我们用星号 * 表示两个 a 败之间的运算.积 
分是关于勒贝格测度进行的.在本书中，这类卷积几乎仅限于*率密度 • 

两个函数之间的卷积的更一*的定义可以定义为 

/ * 9(*) = J— /(*- y)9(»)m{dy}, 

其中 m 表示一个任 意的* 度. (4.7) 中的和表示这样一个特殊 情形， m 集中在正整败上，对毎个正 
整数賦予单位质嫌.在这个童义上，在第1卷 11.2 节中对序列之间的卷积应用星号与我们现在的 
用法是一致的. 
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如果 F 有一个密度/,那么 F "* 有密度 /*/*•••*/(« Ifc ). 我们用 /"• 来表 
示它.这些记号与 1.2 节中引入的记号一致. 


注下列例子表明，两上奇异分布的卷积可能有一个连续密度.它们还表明，卷积的实际 
计算不一定以定义公式为基础. 

例 （ d ) 中的均匀分布是两个康托尔型奇异分布的卷积.事实上设 X u Xv 是一列 

独立同分布的随机变童， X k ( k = 1,2, -.) 取值为0和1的概率都是 I . 我们在 1.11 节例 
( c ) 中曾看到，变量 X = Z 2~ k X k 的分布是均匀的.我们分别用 C ； 和 V 表示偶败项和奇 
数项的贡献.显然，口与 v 独立， x = u+v. 因此，均匀分布是 y 和 V 的分布的卷积.但 
是， c ; 和 2 V 显然有相同的分布，变 ft k 与 l.ii 节例⑷中的变量只是记号不同.换 
句话说，1/和 V 的分布与该例中的康托尔分布的不同之处仅在尺度因子上 • 

例 （ e ) R 2 中的随机向量.具有随机方向的单位向貴的分布集中在单位圆周上.因而关于 
平面上的勒贝格测$是奇 n 昇的.然而，两上独立向 ft 的合向量的长度为是一个集中在 
0^上的具有密度的随机变 S , 事实上，根据余弦定理 L = ^2 -icos W = 

|2 其中 w 是两个向量间的夹角.由于賑从^中的均匀分布，所以我们有 


P{L ^ r } = P ||2 sin iwj < r | = ^arc sin ^ r , 0 < r < 2, 


(4. H ) 


这就证明了断言.（见习® 12.) 


关于增点 


这里必须打断正在进行的讨论，以便例中的记录下关于 F - kG 的增点的一些基本亊实. 
第1个引理在直观上是明显的，而第2个引理是技巧性的.我们只在更新理论中应用它，从 
而在随机游动理论中间接地利用它. 

引理1 如果 a 和6是分布 F 和 G 的增点，坏么 a 十 b 是的增点.如果£*和6是原 
子，那么 a + 6也是一个原子.此外，的所有原子都是这种形式的 • 

证如果 ；( ■与 K 独立，那么 

P{|X + r-a-6|<e}>p||X-o|<|e}p{|y-6|<| e J. 

如果 a 和 b 是增点，则对每个 e > 0,右边都是正的，因此 a + b 也是一个增点. 

用 F a 和 G „ 表示在若尔当分解式 (2.5) 中 F 和 G 的原子型分量. F - kG 的原子型分童 
显然与卷积 F a -kGa 相同，因此 F-kG 的所有原子都具有形式 a + 6, 其中 a 和6分别是 F 
和 G 的原子. 

算术分成所起的特殊作用和正变量所起的特殊作用，都使下列引理的固有的简单性受 
到影响. 
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引理2 设 P 是 R 1 中的一个分布， r 是 F , F 3 *, F 3 *, ■■- 的增点所成的集合. 

( a ) 如果 F 不集中在一个半轴上，那么当 F 不是算术分布时， i 7 在 _ oo , oo 中是拥密 
的； 当 F 是一个步长为 A 的算术分布时， r = {0,± A ,±2 A , - }. 

( b ) 设 F 集中在5^上，但不集中在原 点上. 如果 F 不是算术分布，那么 r 在下述 
意义上是“在无穷远处渐近輞密的”：对于给定的 * > 0和充分大的 a :, 区间 i ^+7 包含 S 
的点.如果 F 是一个步长为 A 的算术分布，那么对于充分大的 》»， r &含所有的点 

证设 0< a <6 是集合 i ： 中的两个点 ，令 h = b - a . 我们区别两种情形 ■ 

⑴对于毎个 e > 0,可以选取这样的 a ,6, 使；》< e ; 

(H) 存在 J > 0, 使得对于所有可能的选择都有 h^S. 

设表示区间 na<x^nb. 如果 - a) > a, 那么这个区间包含 na, (n + 1)°作为 
其真子区间，因此每个点: c > = 至少屑于区间…之一.根据引理 l , n+l 
个点 na + kh(k = 0,1,…, n ) 肩于这些 点把二 分成 n 个长度为/»的子区间.因此，每 
个点 x>x 0 都位于距27的一个点的距离< | 的地方 • 

在⑴的情形下，这蕴含 S 在无穷远处是渐近稠密的.如果这时 F 集中在5^上，则 
结论证毕.否则令 -C > 0是 F 的一个增点.对任意的和充分大的 Ti , 区间 


nc + j/<af<nc + y + e 

包含 i 7 的一点 s . 因为 a - nc 仍厲于所以每个长度为 e 的区间都包含 i ： 的一些点，因 
而 r 是处处稠密的. 

在 （ ii ) 的情形下，我们可以假设 a 和6是这样选择的，以致于 h <2 S . 于是由此推出， 
形如 na + fcfc 的点包括了 E 在 I n 中的所有 的点. 因为 ( n + l ) a 是这些点中的一个，所以 
E 在 I n 中的所有点都是 h 的倍数.现在设 c 是 F 的任一（正的或负的）增点.对于充分大 
的 n , 区间 h 包含一个形如 kh + c 的点；由于这个点属于27,所以 C 是/ I 的倍败.因此， 
在 （ ii ) 的情形下， F 是算术分布. ► 

这个定理的一个特殊情形是很有意思的.每个数 x >0 可以唯一地表示为一个整败 m 
与一个数0 < ? < 1的和的形式 i = n + f 我们称这个 Ugx 的小数部分.现在考虑一 
个集中在两点 -1 和 a > 0上的分布集合2：包含形如 na - m 的所有的点，从而包含 

a , 2 a , ••的小数部分.如果 a = l 其中 p 和 <7是两个互质的正整数，那么这个 F 是一个 
9 

算术分布.在这种情况下， F 的步长等于^因此，我们有下列的系（在 8.7 节的等分布定 
理中将被加强). 

系如果 a > 0是一个无攻敷，那么由 a ,2 a ,3 a ,... 的小数部分组成的集合在071中利 
密. 


5.5 对称化 


如果随机变理 X 的分布为 F , 那么我们用 表示 - X 的分布.在连续点上 
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我们有 

- F ( i ) = l - F (- x ), (5.1) 

这个关系式唯一地确定了 我们称分布 F 为对称的，如果= F . [当密度/ 

存在时，这表示 /(-X) = f ( x ).] 

设 A 和 X 2 是具有共同分布 F 的独立变量，那么 A - X 2 的分布是下列对 
称分布 0 卩： 

°F = F - k ~ F . (5.2) 

利用对称性 ° F (®) = l -° F (- x ), 容 易看出 

°^(*)=仁 F(x + y ) F { di ,}. (5.3) 

我们将称是通过把 F 对 称化得 到的. 

例 （ a ) 指数分布的对称化导致双侧指数分布 [2.4 节 （ a )】； 01上的均匀分布的对 
称化导致 2.4 节 (4.1) 的三角形分布 75. 

例 （ b ) 在±1上具有 质贵为 ^的原子型分布是对称的，但不是经过对称化得到 
的 • 

例 （ c ) 设 F 是一个原子型分布，对0,1, ••賦 予质 MpthPi ，….对称化了的分布 
° F 是一个原子型分布，点 ± n 具有质 M 

9 n = 5 IpfcPfc + n , q-n = 9 n - (5.4) 

k =0 

当 F 是泊松分布时，对 n > 0,我们有 

°° n n+2k 

9" =e_2Q E fe!( n + fc)! = e " 2a/ «( 2 °)« ( 5 . 5 ) 

其中 4 是在 2.7 节 (7.1) 中定义的贝塞尔* 數. （见习题 9. ) ► 

利用对称化可以避免许多凌乱的论证.在这方面，重要的是 F 的尾部和的 
尾部可比较大小，用下列不等式可使这个陈述更为 精确. 当用随机变量而不用分布 
本身来表示这些不等式时，它们的意义就更清楚. 

引理1 对称化不 等式. 如果和义 2 是独立同分布的，那么对于 t >0, 

P ^ Xx - Xi ] > t }^2 P jlA -!! > itJ . (5.6) 

如果这样选择 a > 0, 使 P{Xi < a} > p, P{X, > -o> > p, 那么 

P {|^! - X 2 \ > t }^ pPUH >f + o }. (5.7) 
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特别，如果0是 Xj 的一个中位数，那么 

P {\ X !- X 2 \ > t }> ^{|^|>0. (5.8) 

证除非^或 | X 2 | > 否则 (5.6) 左边的事件不可能发生，因此 
(5.6) 是正确的.如果& >* + <!, X 2 < a , 那么 (5.7) 左边的事件发生,如果 
X ^- t - a , X 2 ^- a , 那么 (5.7) 左边的事件也 发生. 这菹含 (5.7). ► 

我们常用对称化来估计独立随机变董的和.在这方面，下列不等式是非常有用 
的. 

引理2 如果 X 2 , …， X „ 是独立的，且都有对称的分布，那么 + 

也有对称的分布，且 

P{H + ■■■ + X n \> t }^ iptmaxl^l > t }. (5.9) 

如果七 有共同分布 F , 那么 

P {|- X-i + --- + X „|> t }^ i ( l -(5.10) 

证 设随机变童 m 等于 x u …， x n 中使绝对值达到最大的第一项，并令 r = 

- M •在 4 个组合 (± M ± T ) 有相同分布的意义下，对偶 ( M . T ) 的分布是对称 
的.显然 

P{M > t } ^ P { M > t,T >0} + P { Af > t , T <0} (5.11) 

右边的两项有相等的概率，因此 

P{S > t } = P{M + T > t }^ P{M > T > 0} > ip{M > t }, (5.12) 

此式和 (5.9) 相同. 

例 （ d ) 为了证明 (5.10), 注意在连续点上 

P { max | Xj | < t } = { F { t ) - F (- t)) n < 6 -"[ 1 -增+打 -«>1 ( 5 . 13 ) 

这蘊含 （5.10), 因为当0<*<1 时 l - z < e -*. ». 

5.6 分部积分，矩的存在性 

对于 R 1 中的任意期望，也可以利用熟知的分部积分公式. 如果 U 是一有界函 
数，且有一个连续导數 V ,那么 
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J «(x)F{dx} = u{b)F[b) — u{a)F(a) — J ti , (x)F(x)dx. (6.1) 

证经过简单的重排后， (6.1) 可化为 

r^r r b 

J [u(6) — u(®)]F{da:} - J u'(x)[F'(x) — F(o)]At = 0. (6.2) 

假设 | V | < M, 并把 3 分成 n 个长度为 h 的全等区间 Jfc . 容易看出， J fc 对 

(6.2) 左边的贡献的绝对值小于 2 MAF { J fc }. 对*求和我们可以得到，左边的绝对 
值 < 2Mh, 这个值可以任 意小. 因此 (6.2) 的左边确实等于零. 

作为一个应用，我们推导一个常用的公式[它推广了第1卷 11.1 节 (1.8)]. 

引理 1 对任一 £»>0,在如果下式一边收敛，那么另一边也收敛的意义上. 

jT°° i a F{dx} = a i Q_1 [l - F(*)]da：- (6.3) 

证因为积分区域是一个无穷区间，所以不能直接应用 (6.1), 但对毎个& < oo , 经 
过简单重排后有 

j: + x a F{di} = -6 Q [1 - F(b)] + aj: f 1 【1 - 尸 (3 ； )]<11_ (6.4) 

首先假设当 6 — oo 左边的积分收敛.对此无穷积分的贡畎 > 沪 【I - 因 
而鬥 1 - F(b)) 趋 于零. 在这种情形下，在 (6.4) 中取极限6 — oo 可得 (6.3). 另一 
方面，左边的积分小于右边的积分，因此后者的收敛性保证了前者的收敛性，从而 

(6.3) 成立. ► 

对于左尾部也有一个类似于 (6.3) 的公式成立.把这两个公式结合起来，我们 

得到 | 

引理 2 为使一个分布尸有 a >0 阶绝对矩，当且仅当 Wa - Hl-JXaO + J ^- aO ] 
在 575 o 上是可积的. 

作为一个应用，我们来证明： 

引理 3 设尤和 F 是独立随机变量， S = X + Y, 那么为使 E (| S | a ) 存在，当且仅 
当 E (| X |°) 和 E (| y |«) 都存在 • 

证因 为变董 久和 y 具有相同矩，所以不失一般性，可设0是 x 和 y 的中 
位数.但是这时有 P {| S | > <} > ip {| X | > t }, 根据上一引理， E {\ S \ a ) < oo 蕴 
含 E (| X | a ) < oo . 这就证明了断言的“仅当”部分.“当”部分可由不等式< 
2 a (\x\ a + m 推出，因为 | S | 总小于或等于 2| X | 和 2| r | 中的较 大者. ► 
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5.7 切比雪夫不等式 


切比雪夫 ( Chebyshev ) 不等式是概率论中最常用的工具之一.不等式及其证明 
都与离散情形（第1卷 9.6 节）的一样，我们之所以重新叙述它，主要是为了便于参 
考.我们将在 7.1 节中给出有趣的应用. 

切 比霪夫不等式 如果 E ( x 2 ) 存在，那么 

P {| X | > t } < t - a E ( X 2 ), t > 0. (7.1) 

特别地，如果 E ( X ) = m , Vax ( X ) = a 2 , 那么 

P{\X - m | ^ t } ^ a 2 /^. (7.2) 

证如果 F 表示 X 的分布，那么 

E(X 2 )> f i 2 F { dx } 》 t 2 f F { da :}, 

J \ x\>t J \ x \7 >t 

此式与 (7.1) 相同. ► 

切比雪夫不等式之所以有用，并不是因为它的数值估计精确，而是由于它的简 
檢性以及它特别适用于随机变董之和这个 事实. 对它可以作许多推广，但这些推广 
不具有上面所述的性质.（大多数推广非常简单，最好在需要时再推导它们.例如， 
我们将在 7.7 节中叙述切比雪夫不等式与截尾手续的一种有用的结合 .） 

我们可以把推导非平凡不等式的一个相当一般方法叙述如下.如果处处有《 > 
0,并且对于区间/中的所有的 x , u ( x ) > a > 0,那么 

a - WtxpO ). (7.3) 

另一方面，如果在/的外面 u <0, 在 J 内 u < l , 那么可得到相反的不等式 
F { I }> E ( u ( X )). 选择 u 为多项式，我们就可得到只依赖于 F 的矩的不等式 • 
例⑷设 u ( x ) = + c ) 2 , 其中 c > 0. 那么对干所有的彡0;对于 

® > < > 0, u ( x ) > (4 + c ) 2 . 因此 

P{X >«}< ^ jjE((X + c ) 2 ). (7.4) 

如果 E ( X ) = 0, E ( X 2 卜 忒那么右边在 c = f 时取最小值，因此 
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这个有趣的不等式曾被许多作者独立地发现. 

例 （ b ) 设 X 是正的（即 F ⑼= 0), E ( X ) = 1, E ( X 2 ) = b . 多项式 u ( ar ) = 
h~ 2 (x - a)(a + 2 fc - a :) 仅对 a < a : < a + 2 /i 是正的，而且处处有 u ( x ) < 1.当 
0 < a < 1 时，容易看出 E ( ii ( X )) > [2/ i(l - a )- b ] h ~ 2 . 取 /i = 6(1 - a )" 1 , 由这些 
例子前面的说明，我们得到 

P { X > a }>( l - a ) 2 6- 1 . (7.6) 

例 （ c ) 如果 E ( X a ) = 1, E ( X 4 ) = M , 那么对 X 2 应用上一不等式我们得到 

P {| X | > t }>( l - 0< t < l . (7.7) ► 

关于切比雪夫不等式的科尔莫戈罗夫推广见 5.8 节 （ e ). 

5.8 进一 步的不等式，凸函数 

本节收集的不等式具有广泛的用途，这些不等式决不是概率论所特有的.最常 
用的是施瓦兹 （ Schwarz ) 不等式.之所以给出其他的不等式，主要是因为在随机过 
程和统计学中要用得它们.（本节是供参考用的，而不是供阅读用的 .） 

(a) 施瓦兹不等式 

这个不等式的概率形式是说，对于定义在同一空间中的任意两个随机变撤# 
和也 只要下列期望存在，就有 

( E ( ㈣ )) 2 < E (^ 2 ) E ( V > 2 ). (8.1) 

此外，只有当某一线性组合 (up + ⑽ 以概率1等于零时等号才成立.更一般地说， 
如果 F 是集合4上的任一测度，那么对于任意两个使下式右边积分存在的函数 p 
和分都有 

(乂 咖)少(狀恤}) < 乂 々( x 、 F { dx } • [ V » 2 ( x ) F { di }. (8.2) 

取 F 为一个纯原子型测度，它对每个整数賦予单位质童，我们就得到下列形式的 
关于和的施瓦兹不 等式： 

(^2^*) 2 < ZX D 必 (8-3) 

鉴于 (8.1) 的重要性，我们给出两个证明，这两个证明可导出不同的推广.同 
样的证明也适用于 （8.2) 和 (8.3). 
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第 一证明 我们可以假设 E ( V > 2 ) > 0. 于是 

E(<p + 蚴) 2 = E (< p 2 ) + 2 tE (<^) + ^ E ( xl > 2 ) (8.4) 

是 t 的一个二次多项式.由于它是非负的，所以它有两个复根或一个二重根 A . 二 
次方程的标准解表明，在第一种情形下， （8.1) 以严格不等式成立；在第2种情形 
下， E(p + f 奶 2 = 0,从而除一个概率为零的集外都有 ^ + ^ = 0. 

第二证明由于 P 和於 可以由它们的常数倍 ap 和时来代替，所以只要考虑 
W ) = E (矽 2 ) = 1的情形就行了.于是在不等式2|^| + ^中取期望就可容 

易地推出 （8.1). ► 

( b ) 凸函数詹生 ( Jerwen ) 不等式 

设《是定义在开区间/上的一个函数， F =(€, u (0) 是它的图像上的一点.称 
经过 P 的一条直线 L 是《在 C 点的支撑线，如果《的图像完全位于 i 上或 I 的 
上方.（这就排除了垂直线 .） 用分析的术语来说，就是要求，对于 J 中的一切 a :, 

u(i) > n(f) + A • (x - 0. (8.5) 

其中 A 是 L 的 斜率. 称函數 u 在 J 中是凸的，如果在 J 中的每一点 a : 上都存在一 
条支撑戍.（称一个函数 u 是凹的，如果 - u 是凸的 •） 

我们着手证明 • 这个定义蕴含在直观上与凸性有关的各种性质，这种性质可用 
凸折线来说明. 

设 F 是任意一个集中于 J 上的概率分布，又设期望 E(X) 存在.取 f = E ( Jf ), 
并在 （8.5) 中取期望，我们得 


E ( u ) 》 u ( E ( X )), (8.6) 

只要左边的期望存在.这个结论就是詹生不等式. 

最重要的情形是 F 集中于两点：^和 a ： 2 上，并对这两点賦重撤1 - t 和 t . 这 
时 (8.6) 呈如下 形式， 


(1 — t)u(x\) + tu(i 2 ) > u((l - t)xi + txt). (8.7) 

这个不等式有下列简单的几何解释. 

定理1 为使一个函數是凸的，当且仅当它的所有的弦都位于困像的上面或上方. 
证⑴必要性.设 li 是凸的，考虑任一区间 xuxi 上的弦.当 t 从0变到1时， （1 - 
t)x 1+ tx 2 跑遍区间 XT7J2, (8.7) 的左边是弦上对应点的纵坐标.于是 (8.7) 说明， 
弦上的点位于图像的上面或上方. 

( U ) 充分性•设 u 有所述的性质，考虑 u 的图像上的3个横坐标为 H < x 2 < * 3 
的点 Pi,P2,P 3 构成的三 角形. 于是巧位于弦 PiP 3 的下方，在三角形3个边 
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中， PuP 2 的斜率最小， P 2 P 3 的斜率最大.因此，在区间两7石外， U 的图像位于直 
线 P 2 P 3 的 上方. 现在把吻看作一个变童，令叼- ®2+. P 2 P 3 的斜率单调地减少， 
但以 PiP 2 的斜率为下界.因此，直线 P 2 P 3 趋于一条经过 p 2 的直线 L . 在 x^xi 
外， U 的图像位于直线 P 2 P 3 的上方，因此整个图像位于 i 的上面或上方.于是 I 
是 U 在巧点的支撑线.由于: r 2 是任意的，所以 u 的凸性得证. ► 

作为弦的极限，直线 L 是一条右切线.在取极限的过程中 ，朽 的横坐标吻趋 
于 i 2 , 朽趋于 L 上的一点.因此， P 3 — P 2 . 同样的论证对于从左边逼近也成立. 
我们柄言， u 的图像是连续的，在每个点上都有左、右切线.此外，这些切线是支撑 
线，它们的斜率是单调变 化的. 因为单调函数至多有可数多个不连续点，所以我们 
证明了. 

定理2 凸 兩數在 所有的点上都有左、右导數，而且左、右导數都是 不減* 数.它 
们仅可能在可数多个点上不相同. 

显然，这个定理又给出了凸性的充要 条件. 特别，如果存在二阶导数，那么为 
使 u 是凸的，当且仅当 u ">0. 

我们通常把 (8.7) 当作凸性的 定义. 对于《 = ^我们得到不等式 

K (罕) ㈤ ”) ， (8.8) 

此式说明弦的中点位于 U 的图像的上面或上方.如果《是连续的，那么这个性质 
保证图像恒不与弦相交，因此 u 是 凸的. 更一般地可以证明，满足 (8.8) 的任一贝 
尔函数$是凸的. 

( c ) 矩不等式 

我们来证明，对于任一随机变童 X , 

u(t) = lnEd ^ l *), t^O (8.9) 

在使上述积分存在的每个区间中 ，是 t 的凸* 數. 事实上， 根据 施瓦兹不等式 (8.1), 
只要下列积分存在，就有 

E^IXI*) < EdA-I^^EdXI 1 -*), 0 < h < t. (8.10) 

令 H = t - h , a ; 2 = t + h , 我们看出， (8.8) 成立.因此，正如所断言的那样， u 是凸 
的 ■ 

①满足 (8.8) 的每个 U . 或者是凸的，或者在每个区间中它都在 - oo 和 oo 之间振动.见 G. H. 
Hardy, J. E. Littlewood and G. P16ya, InequaUties, Cambridge, England, 1934, 特别见 3.7 
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因为《⑼ < 0,所以连接原点和点的直线的斜率 t ^ uit ) 单调地变化， 
因此 EdXI*) 1 / 4 ^ > 0的不滅函數 • 

( d ) 赫尔徳 （ HSlder ) 不等式 

设 p> 1， 9 > lj-i + g- 1 = 1. 那么对 p >0,分彡0,当下列积分存在时有 

E (㈣)< (E(^)) 1 / P(E(^)) l/fl . (8.11) 

(施瓦兹不等式 (8.1) 是 P = q = 2 的特殊情形，可以类似地推广 （8.2) 和 （8.3).) 
证对 a: > 0,函数 u = log z 是凹的，即它满足带有相反不等号的 (8.7). 取对数， 
XtT x 1 ,i 2 >0, 我们得 

xj -t *2 < (1 - t ) x \ + tea- (8.12) 

与在施瓦兹不等式的第二证明中一样，只要考虑由 E(^) = E(^«) = 1正规化了的 
被积函数就行了•设 f = g -1 , l-t = p _1 . 那么在 （8.12) 中，令 an =#,3； 2 =妒并 
取期望就可推出断言 

( e ) 科尔莫戈罗夫 （ Kolmogorov ) 不等式 

设 X it …， X n 是具有有限方差的独立随机变量，且 E ( X k ) = 0,則对任一 

I > 0, 

P{max[|S,|, --,|5 n |] > x} < aT 2 E (贫） (8.13) 

这是切比雪夫不等式的一个重要加强，在第1卷 9.7 节中我们巳对离散变童推 
导 过它. 那里的证明可以毫不改变地照搬过来，但是我们将用这样一种形式来重新 
叙述它，使得我们可以明显看岀科尔莫戈罗夫不等式可更一般地适用于下鞅.我们 
将在 7.9 节中再回来讨论这个问题. 

证令 a: 2 = f. 对于固定的 t 和 j = l,2, …, n , 用杏表示 u S ]> t , 但对一切下标 
v < 这个事件.用文宇叙述就是，馮是使得 j 为满足珣> t 的下标 * 中 

的最小者的 事件. 当然，这样的指标 j 未必存在，诸事件七之并恰好就是出现在 
科尔莫戈罗夫不等式的左边的 事件. 因为诸事件七是互斥的，所以这个不等式可 
以改写成形式 

^p^-Kr^). (8.14) 

j=i 

用 W 表示事件士的指示函数，即 k 是这样一个随机变量，它在斗上等于 
1,在冯的余集上等于 0. 于是 ZUi < 1,因此 


E(S^0 > 知 ) • 


(8.15) 
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我们将证明 

E(5*/Ai) ^ E ( S ] l Aj ). (8.16) 

因为当砌发生时， S ^> t , 所以右边彡 <P{^}, 从而 (8.15) 化为断言 (8.14). 

为证 (8.16), 我们注意5„ = 5: + (5„-5义因此 

E(^/ a ,) > E(5?/>ij) + 2E((S„ - S ^ SilAj ). (8.17) 

因为变 M 5„ - 5^ = 七 +1 + • • • + X„ 和 Sjl Aj 独立，所以它们的期望满足乘法法 
则，因而右边第2项等于零.因此 (8.17) 化为断言 (8.16). ► 

5.9 简单的条件分布，混合 

在 3.2 节中，我们在随机变 M AT 和 F 的联合分布有一个连续密度的情形下， 
弓I进了 “在:的一给定值下/的条件密度”的概念.由于我们不打算作一般的研 
究，所以我们着手对较广泛的一类分布定义类似的 概念. （系统的理论将在 5.10 节 
和 5.11 节中给出 .） 

对于直线上任意一对区间>1和 S, 令 


Q(A,B) = P{X £A,YeB}. (9.1) 

利用这个记号， A ： 的边缘分布为 

(9.2) 

如果 n(A) > 0,那么事件 {F e 在给定{X € 下的条件概率为 

P{r€ B\X eA} = (9.3) 

(如果 ti{A) = 0, 那么这个条件概率没有定义 .） 当 i4 是区间= x,x + h 时，我 
们利用上述公式，并令 /i —0+. 在适当的正则性条件下，极限 




对于 a : 和 S 的各种选择都存在.按照 3.2 节中所用的手续和推理，在这种情形下， 
我们可以记 

q ( x , B ) = P { Y £ B\X = x ), (9.5) 


并称 g 为“事件 {F e s } 在给定 x = x 下的条件概年 . ”这就把条件概率的概念推 
广到了 “假设”具有零概率的情形•当 g 不充分正则时不会发生困难，但我们不分 
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析适当的正则性条件，因为在下节中将给出一个一般的手续.在特殊情况下这种朴 
索的处理方法就足够了，我们经常可以利用直观推导出条件分布的形式来. 

例 （ a ) 设一对变童 X , Y 有一个联合分布 f { x , y ). 为了简单起见，我们设/是一 
个严格正的连续函数，则 


q{x ' B)= fhI B nx,y)dy, 

其中 Mx ) = 是 X 的边缘密度.换句话说，对于固定的: T , 集函数 g 有 

一个密度 f ( x , y )/ fi ( x ). 

例 （ b ) 设 A ■和 K 是分别具有分布 F 和 G 的独立随机变 M . 为了简单起见，设 
X > 0( 即 F (0) = 0). 考虑乘积 Z = XY . 那么 

P{Z < t\X = x } = G ( t / x ), (9.6) 

Z 的分布函数 f / 可通过关于 F 积分 (9.6) 得到.[见 2.3 节 (3.1). 此断言是下面的 
公式 (9.8) 的 一个特殊情形 .] 特别地，当 X 服从町 中的 均匀分 布时， 

U ( t )= [ G ( t / x ) dx . (9.7) 

Jo 

这个公式可以作为单峰分布理论的一个很方便的起点 .® 

关于进一步的例子见习题18和习题 19. ► 

下面的定理（应归功于谢帕 （ L . Shepp )) 是辛钦发现的一个准则的概率形式. 


定理为使 U 是单峰的.当且仅当它具有形式 (9.7), 即当且仅当它是这样两个独立变量的 
乘积 Z = AT 的分布 ，使得 X 服从 ? TT 中的均匀分布. 

证取/ 1 > 0 , 用队表示这样一个分布函败，它的图像是在点 0 , 土 fc , …上与重合的折 
线. [换句话说， U „( nh ) = U ( nh ), U h 在区间 nh ,( n + l )^ 上是线性的 .] 由定义显然可见，为 
使 U 是一个单峰分布，当且仅当所有的是单峰的 . 有一个密度是一个阶梯 
函数，每一个在形如的点不连续的阶梯函数可以写成如下形式 

以^ ㈤ ， （*) 

其中， 当0 < a : < 1时， /( a :) = 1. 对于 a : 的其他值， /(*) = 0. 为使函数 （*) 在5^5和 
上是单调的，当且仅当对于所有的 n ， p „ > 0;如果 EPn = 1,那么 （*) 是一个密度. 
但是，在这种情况下， （*) 是这样两个随机变量的乘积= XY h 的密度，使得 X 脤从 5 TT 
上的均匀分布，且 P{K = nh } = p „. 于是我们证明了， 为使 U h 是单峰的，当且仅当它具 
①当且仅当1/的图供在=55^5中是凸的，在0^5中是凹的时候.我们称分布 a 败 t ； 是一个众数 
在原点的单峰分[见 5.8 节 （ b ) l . « 点可以是不连续点.但除此之外， 单峰性 还赛求存在一 
个密度 U , 它在二5575和0^5中均为单调的.（不排除常值区间 .） 
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有形式 （9.7)( 把 G 换为一个集中于点0, ±/»,…的算术分布 G h ). 令 — 0,由单调收敛性， 
我们得到了本定理. 

(见习题25、习題126和 15.9 节中的习题 10.) ► 

在适当的正则性条件下，对于固定的 x , q ( x , B ) 表示 B 中的一个概率分布■，对 
于固定的 B , q ( x , B ) 表示: r 的一个连续函数.于是 

Q ( A , = J / x , B ) n { dx }. (9.8) 

事实上，右边显然表示平面上的一个概率分布，利用 (9.4) 中的微分可得 q ( x , B ). 
公式 (9.8) 说明怎样用一个条件分布和一个边缘分布来表示 R 2 中的一个给定分布. 
用 2.5 节中的术语，它把给定的分布表示为一个依赖于参数 a ; 的分布族的 
混合，其中 P 是随机参数 a : 的分布. 

在实际中，我们常常把上述手续倒 过来. 我们从 一个“随机核开始， 这里 g 是 
技 x 和集合 B 的一个函数 q ( x , B ), 使 得对于固定的 a :, 它是一个概率分布；对于 
固定的 B , 它是一个贝尔 函数. 给定任一概率分布 M , (9.8) 中的积分就定义了形如 
( A , B ) 的平面集合的概率，从而定义了平面上的一个概率 分布. 通常用点函数表示 
(9.8). 考虑一个依赖于参数0的分布函数族 G (0, y ) 和一个概率 分布叫 那么可定 
义一个新的分布函数 

U ( y ) = J G ( x , y ) n { dx }. (9.9) 

[这个公式表示 （9.8) 在4 = - co , oo , q ( x , - oo , y ) = G ( x , y ) 的特殊情形 .] 这种混 
合曾出现在第1卷第5章中，我们在 2.5 节中讨论过 它们. 在下一节中将说明， < z 恒 
可解释为一个条件概率分布. 

例 （ C ) 如果巧和 F 2 是分布，那么 pFl + (1 — p ) F 2 是一个混合分布 (0 < p < 1), 
它表示 （9.9) 在#集中于两个原子上时的特殊情形 • 

例 （ d ) 随 机和. 设 X 2 , …是具有共同分布 F 的独立随机变量.设 AT 是一个 
与独立的随机变董，它以正概率 po , Pl ,. •取值 0,1，".. 我们感兴趣的是随机 
钱 SfXA … + X N . S N 在给定 N = n 下的条件分布是 F "*, 因此知的分 
布为 oo 

U = Y J p n F n *, (9.10) 

此式是 (9.9) 的一个特殊情形.在这种情形下，每一个假设 N = n 的概率都是 
正的，因而我们得到的是严格意义下的条件概率分布.其他的例子可在 2.5 节〜 2.7 
节找到.（见习题21和习题 24.) 
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研究使条件概率9可以由 (9-4) 式中的傲分过程来定义的精确条件是无意义 
的.条件概率的主要性质包含在关系式 （9.8) 中，此式用条件概率表示集合的概率， 
利用 （9.8) 式作为条件概率的定义是最简单的.它不唯一地确定1因为如果对每个 
集合 B , 除了一个零测度集外都有 q ( x , B )=^ x , B ), 那么把<?换成5后， (9.8) 
仍然成立.但是，这种不确定性是不可避免的.例如，如果 M 集中在区间 J 上，那 
么对于 J 外的的自然的定义是不可 能的. 实质上，我们讨论的是整个一类等价 
的条件概率，我们应说“一个》条件概率分布 g 而不应说“那个”条件概率分布？. 
在个别的情况下，通常存在一个由正则性条件支配的选择. 

为了确定起见，我们只考虑由形如 X e 4和 y e B 的条件确定的事件，其中 
a •和 y 是给定的随机变 M , 4和 S 是直线上的波雷尔集.我们首先看一看“亊件 
{ YeB } 在给定的 X 下的条件概率”的各种不同含义 . X 的给定值可以是一个固 
定数，也可以是一个未定数. 对于 第2种解释，我们得到 X 的一个函数，即一个随 
机变 M . 我们将用或 q ( X , B ) 等来表示它.为了强调起见，我们把在固定 
盘 x 上的值记为 P { K € B\X = i } 或咖, S ). 

定义 1 设集合0是固定的. P { Y £ B | X } (用文字来说就是 “事件 {y e 在给 
定的 X 下的 条件概牟”） 是这样 一个* 数 q { X , B ), 使得对于 R 1 中的每个集合 

P{X e A,Y e B } = J^q(x, B ) n { dx }, (10.1) 

其中 p 是久的边缘分布. 

当 a : 是一个原子时， X = x 这一假设具有正概率， P{r e B\X = x ) 巳经由 
(9.3) 定义了，其中4由一点 z 组成. 但是在这种情形下， (10.1) 化为 (9.3), 我们的 
定义和记号是一致的. 

我们来证明，条件概率 P{Ye 桠 存在.事 实上，很显然有 

P{X G y € B } < fi ( A ). (10.2) 

对干固定的 S , 右边作为4的函数，确定了一个有限 测度. (10.2) 苗含这个测度是 
关于 M 绝对连续的（见 5.3 节的拉东-尼科迪姆定理).这说明我们的测度由一个密 
度9所确定，因此 （10.1) 是正确的. 

到现在为止，集合 S —直是固定的，但是我们之所以选择记号 g ( z , B ) 是为了 
改变 S . 换句话说，我们要把9看作是两个变量（点; r 和直线上的集合 B ) 的函数. 


* 本节初读时可略去. 
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我们要求，对于固定的 A 集函数 g 是一个概率测度，这要求 q ( x , B . 1 ) = l , 并且对 
于任意一列并集为 B 的不相交集序列 

Q ( x , B ) = ^2 q ( x , B k ). (10.3) 

如果右边诸项表示 S * 的条件概率，那么这个和就是 S 的一个条件概率，但是还有 
另外一个一致性要求，即 (10.3) 对于我们的 g 和 a : 的一切选择都是正 确的. [注意 
定义1不排除在个别点 a ： 上的不合理选择 q ( x , B ) = 17.) 不难看出，可以选出满 
足这些条件的 9(®, B ).® 这表明在下列意义上， 存在一个 y 在给定的 X 下的条件 
概牟分布. 

定义2 所谓 y 在给定的 x 下的条件概牟分布，指的是这样一个二元（点3：和集 
合 S ) 錢 q , 使得 

( i ) 对于一个固定的集合 B , 

9 ( X , B ) = P{y GS | X } (10.4) 

是事件 {y e B } 在给定的 X 下的条件概率 i 

( ii ) 对于每个 a :, g 是一个板芈分布 • 

事实上，一个条件概率分布是一族普通的概率分布，因而整个理论可以照搬过 
来.因此，当9是给定的时候 ®, 下面的定义引入了一个新的记号，而不是一个新 
概念. 

定义3 条件期望 E ( y | x ) 是 x 的一个兩數，它在 z 上取值 
r+°° 

E ( y | x ) = J yq ( x , dy ), (10.5) 

只要积分收致（可能除了在一个概牟为零的 a ; 集合上以外). E ( y | X ) 是 X 的一个 
兩數，即一个随机变量.为了清楚起見，有时用 E(ypr = a ：) 表示它在点 I 上的值. 
由定义得 ^ 

E ( K ) = J E ( y | a :) Ai { dx } 或 E ( r ) = E ( E ( y | X )). (10.6) 

® 最"^易的是，只对这样的 B 直接选择 q(i, B ) 的值，其中 B 是 R 1 的二进制«分中的一个区间. 
例如，设 Bi = 0^5, Bi, = =^75.选 9(*,^) 为 Bn 的任一满足0 彡 ^ 1的条件 
概率.那么 9(*,B 2 ) = 1 自然是一种合理的选择.把历分成和 Sis, 并选取 

9(®.Bu ) 使得0^ q ( x , Bi ). 令 g(*,Bia) = -g(a：,Bii), 按照同样的方 

式无穷地细分下去.那么利用可加性 要求， (10.3) 就可对所有的开集从而对所有的傅宙尔集 fl 
定义 q ( x , B ). 

这个构进仅依赖于所谓的网格的存在性，这种网格把空间分成有限多个不相交集合，毎个集合 
再以同样的方式进行划分，这个空181的每一点都是一个出现在逐次划分中的递缩集序列的唯一极 
«■ 因此.此断言在中和许多其他空间中也是正碥的. 

® 关于更炅活的一般定义，见 5.11 节. 
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*5.11 条件期望 

我们巳用条件分布定义了条件期望 E(Y\X), 如果只讨论一对固定的变童； r 和 
Y, 这是十分令人满足的.但是，当我们讨论一族随机变董时，各个条件概率的不唯 
一性将导致很大的困难.幸好在实际中可以不用这个不适用的理论.实际上，原来 
可以不用条件分布而给出一个极其简单灵活的条件期望理论.为了理解这个理论， 
最好从仔细研究恒等式 (10.5) 开始. 

设 A 是直线上的一个博雷尔集，用 U(X) 表示当 X€A 时等于1而当 XeA 
时等于0的随机变董.我们在 (10.5) 的两边关于 X 的边缘分布 m 进行积分，取集 
合4为积分区域.结果可以写成形式 

E{Yl A (X)) = f E ( F | i )^{ dx } = 厂 0 ^ ⑻ E ( i »{ dx }. (11.1) 

Ja J-oo 

变 M X 把样本空间 e 映到实直线上，上面的积分只与此直线上的函数和测度有 
关.但是，随机变最 Yl A (X) 是定义在原先的样本空间中的，因而需要一种更好的 
记号.显然，是6中一个集合 S 的指示函数，即 S 是6中所有这样的点所 
组成的集合，使得 X 在这些点上所取的值厲于 A . 正如我们在 4.3 节中所看到的 
那样，所有按这种方式对应于直线上的任意博雷尔集4的集合构成一个6中 
的 a 代数，我们称这个 a 代数为 A •产生的 代敷. 丁-是 (11.1) 表明 [/ = E ( y | X ) 是 
X 的一个 函数： 对于 X 产生的 tr 代数中的每个集合 S , 它满足 

E{Yl B ) = (11.2) 

我们将看到，这个关系式可以作为条件期望的一个定义，因此正确地理解它是非常 
重要的.一个简单的例子将说明它的本质. 

例 （ a ) 我们取坐标 变董为 A ■和 F 的平面作为样本空间，并且为了简单起见，假 
设概率由一个严格正的连续密度 f[x,y) 所 确定. 随机变贵 X 在平行于 y 轴的任一 
直线上取常 数值. 如果4是 a : 轴上的一个集合，那么相应的乎面集合由所有通过 
A 中一点的直线所组成. (11.2) 的左边是 yf{x,y) 在这个集合上的普通积分，它可 
以写成累次积分的形式.因此 


E(rifl) 


=/产/:: 


Vf(x,y)dy. 


(11.3) 


( II . 2 )的右边是函数 U{x)h{x) 的普通积分，其中 A 是 X 的边缘密度.于是在这 


* 本节的理论只在 6.12 节和 7.9 节中被应用于鞍上. 
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种情 形下， (11.2) 说明 


U { x ) = j ^ yf ( x , y ) dy . (11.4) 

这与条件期望的定义 (10.5) 及直观是一致的. 

例 < b ) (续)我们现在来证明，即使当密度不存在，平面上的概率分布是任意的时 
候， (11.2) 也定义一个条件期望.给定 z 轴上的一个博雷尔集八 (11.2) 的左边就确 
定一个数显然， m 是一个定义在轴的所有博雷尔集合上的 测度. 另外一 
个这样的测度由 X 的边缘分布 /X 给出，它被定义为 MX } = E ( U ). 因此很明显， 
如果 fi { A } = 0,那么有 Ai ,{> l }=0. 换句话说， Mi 关于 M 是绝对连续的，根据 5.3 
节的拉东-尼科迪姆定理，存在一个函数 [/, 使得 

Mi {^} = V { x ) h { Ax ). (11.5) 

这与 (11.2) 只在记号上有所 不同. 当然，如果在一测度为0的集合上改变 C / 的值， 
那么 (11.5) 仍是正确的，但是这种不唯一性是条件期望的概念所固 有的. ► 

这个例子说明，对于任一概率空间中的任意一对随机变 Mx , y , (11.2) 可以用 
来定义条件期望 U ( X ) = E ( y | x ) [当然要假设 E ( y ) 存 在]. 但是，这种处理方法可导 
致进一步的 结论. 例如，为了定义一对随机变 M 的条件期望 

我们仍可利用 (11.2), 只是 S 现在是和义 2 产生的代数 ® 中的任意一个集 
合（见 4 .3节).当然， U 是 X U X 2 的一个函数，但是我们在 4.4 节中看到过，对偶 
(^1,^2) 的贝尔函数类与所有的 ® 可测函数所成的类重合.因此，我们可以用杜布 
( Doob ) 首先提出的下列定义来包括所有可能的情形. 

定义设 （6, U ， P ) 是一个概牟空间，田是 it 中的一些集合组成的一个代數（即 
® cii ). 设 y 是一个具有期望的 ft 机变量. 

我们称随机变量[/为 Y 关于® 的条件期望，如果它是®可測的，并且 (11.2) 
对®中的所有集合 B 都成立.在这种情形下，我们记 C / = E ( y |»). 

持别地，当*是由随机变量 Xi ,- -,Xr 产生的 （ T 代数时，变量汉化为 
Xi ,- -, X r 的一个贝尔函数，我们将用 Eyn ，…，不 ■) 来表示条件期望. 

E ( y |») 的存在性可通过例 （ b ) 中指出的方法使用抽象的拉东-尼科迪姆定理 
来证明. 

为了看出条件期望 c / = E ( r |») 的主要性质，注意当把 i B 换为 b 中的集合 
Bj 的指示函数的线性组合时， (11.2) 显然也成立.但是我们在 4.3 节中已看到，每 
个 ® 可测函数都可以用这样的线性组合一致地逼近.取极限可以看出， （11.2) 藴 
含，对于任一®可测函数么，更一般地有 E ( YZ ) = E ( UZ ). 把 Z 换为并与定 
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义 (11.2) 比较，可以看出，对于任一®可測禹數 Z， 

E(KZ|®) = ZE(Y\V5). (U.6) 

这是一个很重要的关系式. 

最后，考虑一^。代数®0 C »，并设1/ 0 = E(y|® 0 ). 对于％ 中的一个集合 
B, 我们既可以关于®也可以关于 ® 0 解释 (11.2), 于是我们得到，对于®0中的 
B, 

E(Yl B ) = E{Ul B ) = E(U 0 Ib ). 

因此，根据定义有％ = E(!7|Bo), 从而如果®0 C 那么 

E(K|B 0 ) = E(E(K|«8)|Bo). (11.7) 

例如，》可以是两个变量 X x ,X 2 产生的 tr 代数 ，而！ 8 0 表示只由 Xi 产生的 (T 代 
数.于是 (11.7) 化成 E(y|X!) = E(E(y|X 1 ,X a )|A-i). 

最后我们注意， （11.2) 里含，对于常数1,无论怎样选择 ®, 条件期望总等于 

1. 因此， (11.6) 组禽， 对于所有的》可測变量 Z,E(Zlf8) = Z. 

几乎没有必要说明期望的基本性质可以搬到条件期望上. 

5.12 习 题 

1 •设 A •和 y 是具有分布函数 F 和 G 的独立变量，求 (a)JfU^. (b) (c) 

2xur, ⑷ X 3 \JY 的分布函 数①. 

2. i* •合•设 X，y，Z 是独立的,久和 y 有分布 F 和 G, 而 P{Z = 1} = p,P{Z = 0} = 
</(p+g = l).*(a)《X + (l-Z)y, (b)ZX + (l-Z)(X[jy). (c)ZX + (l-Z)(XDY) 
的分布函数. 

3 . 如果 F 是一个连续分布函败， （a) 由第一个积分的定义（把=55^5分成子区间 )，（b) 
通过把左边解释为 E(F(X)), 其中 F(X) 脤从一^均匀分布，证明 

/oo F ^ F ^ dx y = J 0 y d y = 

更一般地，令 G(x) = F"(a:), 证明 

£ y _ 卜点. 


①如果 a 和 b 是数，那么 aUb = max ( a ,6) 表示两败中的较大者， a 门6= min ( a ,6) 表示两败中的 
较小者.对于函败， / U 9表示在点 * 取值 f(x)C\g(x) 的函数（见 4.1 节).于是 • XflY 和 Xljy 

是随机变 S . 
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4. 设 F ( x ， y ) 表示平面上的一^概率 分布. 当 *<0, V <0 时，令 U ( x , y ) = 0 . 在所有其 
他点处，令 U ( x , y ) = F ( x , y ). 证明， J7 对毎个变擞都是单调的，但不是一个概率分布 • 
[提 示， 考虑混合差 .} 

5. 相定的边缘分布® 设 F 和 G 是 R 1 中的分布函数， 

V ( x , y ) = F (*) G ( v)[l + a ( l - F ( x ))( l - G ( y ))], 

其中 |a| < 1. 证明， U 是 R 2 中的一个具有边缘分布 P,G 的分布函数，并且为使 U 
有密度，当且仅当 F 和 G 有密度. 

提示：如果 w ( x , y ) = u ( x ) v ( v ), 那么 （1, 12) 中定义的 w 的混合差具有形式 AuAv , 
而且注意 A ( F 3 ) < 2AF. 

6. 在单位正方形内部，如果 * ( y, 则令 [/( x tV ) = x , 如果 * > »,则令 U ( x , y ) = »•证 
明，1/是一个集中在对角线上的分布函败（因而是奇异的). 


7. 具有指定边缘分布的 糸當歇 (FWchet) 最大 分布. 设 F 和 G 是 R 1 中的分布函败, U ( x , y ) 
= F(a:)nG(»). 证明， ⑷1/是一个具有边缘分布 F 和 G 的分布函败 .（b) 如果V是 
具有这个性质的任一分布，那么V < I/. (c)l； 集中在由 F(i) = G ( y ) 确定的曲线上， 
因而是奇异的.（习题5包含--个特殊情形 .） 

8. 用1/表示中的均匀分布，用 r 表示中的三角形分布 【见 2.4 节 （b)], 那 
么 FWW / 和的密度为 

h -^ F^x + /»)- F { xmh - 2 J o [ F(x + y )- F ( i - y )) dy . 

9. 设独 立变量 A ■和 K 脤从期望为 pt 和 gt 的泊松 分布. 如果/« ■是 2.7 节 （7.1) 中定义 
的贝塞尔函数，证明 


P { X-Y = k } = e- , v /^7i) E /,*|(2tVfg). 

10. 对于-个使得 

V>(a) = J + \ ax F{dx} 

在 -a < a： < a 中存在的分布函数 F, 用 ,j(a)F # {dx> = e a *F{dx} 定义一个新分 
布 F # . 设巧和 ft 是两个具有这种性质的分布， F = 证明（用明显的记 

号 ) ， ^(a) = <p t (a)<fi2(a),F* = FfirFf. 

11. 设 F 具有质量为 pi.pa , 的原子 ai,as, …. 用 p 表示 pi,pa,... 的最大值.利用 5.4a 
节的引理1证明 

(a) 除了 F 集中在有限多个有相等质量的原子上的情形外， F - kF 的原子的质量严格 
小于 P; 


①本理包含•具有正态边缘分布的非正态分布的新例子（见 3.9 节中的习題2和习雇 3). 这应归 
功于古 典别尔 (Gumbel). 
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( b ) 对于对称化了的分布原点是一个质量为 〆 = ZpI 的原子，其他的原子的 
质量严格地小于 〆 • 

12. R 3 中的随机向量.设 i 是两个具有随机方向的独立单位向量，即端点是在单位球面上 
均匀分布的合向量.证明■对于0 <* < 2, P{L < i } = i 2 /2. [jSL 5.4 节例 （ e ).] 

13 . 设 A 是相互独立的变量，取值0和1的概率都等于 I . 5.4 节例⑷巳证明了， A ： = 

在町中是均匀分布的.证明 E 2- 3 fc X 3 fc 的分布是奇异的. 

14. ( a ) 如果 F 有这样一个密度/,使得尸是可积的，那么 F-kF 的密度/ 2 是有界的. 
( b ) 利用 4.2 节中的平均逼近定理 证明： 如果/是有界的，那么/ 3 是连续的. 

[如果/在一个点的附近是无界的，那么可能出现这样的情况 | 对于每个 n ,/"* 都是 
无界的•见 11.3 节例 （ a ), j 

15. 利用施瓦兹不等式 证明： 如果：是-一个正变量，那么对于所有的 P > 0, E ( A -»>) > 

16. 设 X 和 y 有这样的密度/和 j ?, 使得当 x < aBt , /⑻> S ( i ), 当 a ： > a 时， /(®) < 
S (*). 证明： E ( X )< E ( V ). 而見，如果对于 I < 0有 /( x ) = < 7 ( 1 ) = 0,那么对于所有 
的 fc 有 E(X) h ^ E ( y *). 

17. 设 • 是相互独立的， R 有共同分布 F . 设； V 是一个母函数为 P («) 的正整值 
随机 变量. 如果 W 与&独立，那么 max [ X ,, --, XA ,] 的分布为 P ( F ). 

18. 设 XuX,， … X„, 是相互独立的，且有共同的连续分布设 ； f = max 【 AV ", X „ l , 
y = min [ X ,,- -, X n ]. 那么 

P{X ^x,Y>y} = (F(x) - F( V )) n , y<x, 

p{y>v\x =*}= i ( F (*) - j %) 师 r - 1 . 


19. 利用同样的记号，对于每个固定的 Kn 有 


[• n- 1 F { x ) 

[ 1 , 


X <t, 
x^t. 


(a) 通过考察事件 { X k = X } 的直观含义， （b) 在形式上由 (9.4) 来推导上述等式. 

20. 读.证明 

21. 随机和.在9节例 （c) 中，设 X* 等于1和 -1 的概率分別为 p 和 9 = 1 -p. 如果 JV 
是一个期望为 t 的泊松变量，那么 S/v 的分布与问题9中出现的分布 相等. 

22. 混合.设 (9.9) 中的分布 G 的期望为 m(*), 方差为 a 3 ( x ). 证明，混合分布1/的期望 
与方差为 

o = J m(*)/i{da:}, 6 = J tr 2 ⑻ /i{da:} + / (m 2 (*) - o 2 )^{da:}. 
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23. 利用明显的记号 E ( E ( y | X )) = E ( y ), 但是 

Var ( V ) = E ( Var ( y | X )) + Var ( E ( y | X )). 

习题22是一个特殊 情形 . 

24. 随机和 .在 5.9 节例 （ c ) 中， E ( S n ) = E ( N ) E ( X ), 

Var ( Sw ) = E ( N )\ ax (, X ) + ( E ( X )) a Var ( JV ). 

直接证明这两上等式，并证明它们包含在习题22和习埋23中 • 

注 以下的习题涉及 5.9 节的脚注中定义 的单峰分布的卷积 . 有人猜想两个单峰分布 
的卷积还是单峰的.钟开莱构造了一个反例.习题25包含另外一个反例.习题鉍证明 
了这个猜想对 f 对称*分布是正 确的. 这个结果应归功于温特纳 ( Wlntner ). 

25. 对于0 < a : < 1，令 u ( x ) = 1；对于 * 的其他值令 u ( x ) = 0.令 

其中 0< a <6. 如果 e 和 a 很小， M 艮大，那么 w = v ♦ v 不是单峰的，虽然 v 是单峰 
的. 

为避免计算的提示， 两个均匀密度的卷积是三角形密度，从而访⑷> > 

e a a ~\ w 的从6到26的积分> ^(1 - e ) 2 . 由此推出， to 应在 a 和6的中间达到最小 
值. 

26■设 F 是一个均匀分布， G 是一个单峰分布••如果 F 和 G 都是对称的，用简单的微分 
法 证明： 卷积是单峰的.由此推出（不用进一步的计算)，当 F 是对称均匀分布 
的任一混合时，上一陈述仍然正磽. 因此，对称单峰分布的卷积是单峰的 . 


①关于在非对称的情形产生 的困嫌 ，见 I. A. Ibragimov, Theory of ProbbUity and Its Applicationa, 
vol.l(1956)pp.22S-260.['IYaiislatioii8.] 



第 6 章一些重要的分布和过程 

本章是为了在供独立阅读的各章之间避免重复和交叉参考而写的.例如，我们 
将分别地用半群方法（第9章)、傅里叶分析（第18聿)、（至少部分地用）拉普拉斯 
变换（第13章）来独立地讨论稳定分布理论.在适当的地方给出定义和例子可以节 
省篇幅，并且可以不必考虑方法的纯正而仔细研究一些基本关系. 

本聿所包含的各个课题在逻辑上不一定有联系 • 排队过程和鞅论或稳定分布 
理论几乎没有什么关系.本章不是为连续阅读而写的，应该等到以后用到哪一节时 
再回过来阅读它. 6.6 节〜 6.9 节之间相互有些联系，但与其他部分无关.它们讨论 
了本书中别的地方不包含的一些内容. 


6.1 R 1 中的稳定分布 

稳定分布作为正态分布的一种自然的推广，起着越来越大的作用.为了便于叙 
述稳定分布，我们引入缩写记号 

U = V (1.1) 

来表示随机变量1/和 V 有相同的 分布. 因此， U^aV + b ^ t / 和 V 的分布的差 
别仅在于位置参数和尺度参数不同.（见 5.2 节的定义 1.) 在本节中， X , X x , X 2 ,- - 
表示具有共同分布丑的独立随机变憊， 5 n = X 1 + - + X „. 

定义 1 我们称分布为（广义）穗定的，如果对于每个 n, 都存 在常数 c„ > 0, 7 n, 
使得 ® 

S n = CnX + y n , (1.2) 

并且不集中在一点上.称 fl 为严格穗定的，如果 （1.2) 对于 7 n = 0成立 • 

例子可以在 6.2 节中 找到. 稳定分布的某些基本性质的初等推导是如此具有启 
发性，以致于我们不惜重复来讨论它们.第9章和第17章中发展起来的系统的理 
论不依赖于下列讨论. 

定理1 正规化常數具有 c „ = n 1 / 0 的形式，其中0 < a < 2. 我们称常数 a 为 R 
的特征栺數. 


①关于男外一种形式见习《 1. 
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证利用对称化可以大大简化证明.如果丑是稳定的，那么的分布 
也是稳定的，正规化常数 h 相同.因此，只要关于对称稳定的来证明这个断言 
就行了. 

我们从一个简单的陈述开始， S m + n 是独立变量 S m 与 S m+ n - 的和， 

和 S m + n - S m 的分布分别与和的分布相同.因此，对于对称稳定分布， 



类似地，和 5 rfc 可以分解成 r 个独立组，每组有 fc 项，从而对于所有的 r 和 fc , = 
CrC k . 对于形如 n = P 的下标，我们用归纳法得到， 

如果 n = r v , 那么 c „ = cj !. (1.4) 

其次设 《 = rn + T », 并注意到，由 (1.3) 中变撤的对称性，对于 t >0, 我们有 
P{X > t }> ip { X 2 > t ^/ Cn }. (1.5) 

由此推出，对于> n , 比 Cn / C , 是有界的. 

对于任一整数 r , 存在唯一的一个 a , 使得 Cr = r 1 /-. 为了证明 c „ = 只 
需 证明： 如果 CpS /) 1 #, 那么卢二江由（ I . 4 )知， 

如果《 = 7^,那么 Cn = n 1/a ； 

如果《 = 〆 ，那么 C „= t » 1 ^. 

但是对于每个 v = 〆 ，存在一个 n = f °, 使得 n < v ^ m . 于是 
C = v 1/0 ^ = r il 0 i ^ l p . 

因为比 cn / c ,, 是有界的，所以/3 < a . 并换 r 和 p 的位置，可以类似地得到 0 > a . 
因而 /3 = a . 

为了证明 a ^2,我们说明，正态分布是特征指数为 a = 2 的稳定分布.对于 
此分布， (1.3) 化为方差的加法法则，加法法则蕖含，任一具有有限方差的稳定分布 
必然对应于 a = 2. 因此，为了完成证明，只需证明，满足 a > 2的任一稳定分布 
都有有限方差. 

对于对称分布，当 v „ = 0时 (1.2) 成立.因此，可以选择这样的 <,使得对于 
所有的 n , P {| S n |>< c „}< i 由对称性，这蓮含 n[l - fl ( tc „)] 是有界的[见 5.5 节 
(5.10)1. 由此推出，对于所有的 a :> f 和适当的常数 M ， i a [ l - i ?( i )】< M . 因此，区 
间2*- 1 < x <2 k %i E ( X 2 ) 的积分的贡献以 A /2( 2 -«)* 为界. 对于 a >2,这是一个 
收敛级数的通项. ► 
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稳定分布理论被这样一个令人满意的事实大大简化，即在实际中可以不考虑 
中心常数 tv 这是因为我们能以任意的方式规定分布 Ji 的中心，即可以把 i ?( a :) 换 
为 i ?( a : + 6). 下列定理表明，除 a == 1外，我们可以利用这种自由性把从 (1.2) 
中消去 ■ 

定理2 如果是穗定的，且指数 a /1, 那么可以选择这样一个中心常数6,使 
得 iiOr + b ) 是严格穗定的. 

证是 m 个独立变量之和，其中每个变量的分布与 c„X + «„的分布相同.因 
此 

Smn = + 爪 Wn = ^ (1-6) 

因为 m 和 n 起的作用相同，所以这表示恒有 

(Cn - n ) v m = (Cm - (1.7) 

当 a = 1时，这个陈述是无意义的， ® 但是当 a / 1时，这蕴含，对于所有的 
n ^^ bicn - n ). 最后由 (1.2) 可见； n 个与 f - &有相同分布的变童之 和死满 
足条件見总〜义，. ► 

关系式 （1.3) 是由 (1.2) 在= 0这个唯一的假设下推导出来的，从而它对于 
所有的严格稳定分布都成立.这蕴含，当比 s / t 是有理数时， 

s 1/a Xi + t 1/ a X 2 =(« + t ) l < a X . (1.8) 

利用简单的连续性就可得到 ®. 

定理3 如果是严格穗定的，且4旨數为 a , 那么 （1.8) 式对所有的 s >0 和 t >0 
都成立. 

对于正态分布， (1.8) 式只是重新叙述了一下方差的加法法则.一般来说， (1.8) 
式癟含，所有的线性组合 ai X x + a u X 2 都属于同一类型. 

正态分布《之所以重要，主要是由于中心极限定理.设 A ，…,叉„是具有共 
同分布尸的相互独立变量，而且它们期望为0,方差为1•令=不+… + X „. 
中心极限定理 ® 断言， S „ n - i 的分布趋于 W . 对于方差不存在的分布，也有类似的 
极限定理，但必须用同的方式选择正规化常数，有趣的是，稳定分布是作为这样的 
极限出现，而且只有稳定分布可以作为这样的极限.下列术语将有益于讨论这个问 
题. 

定义2 称独立随机变量 X k (k = l ,2, --) 的分布 F 属于分布丑的吸引城，如果 
存在这样的正规化常數0„>0,6„,使得 a -^ Sn - bn ) 的分布超子丑. 

® 关于 a = 1的情形，见习題 4. 

® 关于稳定分布的边续性，见习 * 2. 

® 中心极限定理证明了，正态分布是唯一的具有方差的稳定分布. 
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最后一个陈述可以改 述为： 当且仅当是穗定的时候， fl 有一个吸 引域. 实际 
上，根据定义，毎个稳定的 A 厲于它自己的吸引域.由定理1中所用的论证，似乎 
不可能有其他的分布能作为这种极限出现. 

我们的结果有相当重要且出人意料的 推论. 例如，考虑满足 （1.8)( 其中 a < l ) 
的稳定分布.平均值 （A +…+义„)/«和有相同的分布，最后一个因 
子趋于 oo . 粗略地说， n 个变童的平均值很可能远远大于任一给定的分量.这 
只在最大项 =_[& ，…， X „] 可能增加到非常大且受总和的影响非常大时 
才可能发生.更精确的分析证实了这个结论.在正变量的情形下，比 S „/ M „ 的期 
望趋于 （1 - a )- 1 , 这对任一其分布厲于我们的稳定分布的吸引域的序列也正确（见 
13.11 节的习埋 26.) 

关于历史的注稳定分布的一般理论是由列维 （ L 4 vy )(1924) 开创的 ®, 他求出了 
所有严格稳定分布的傅里叶变换.（最初称其他的分布为拟稳定的.正如我们已经看 
到的那样，只有当 a = 1时它们才起作用.列维和辛钦两个人分析了这种情形 .） 由 
于发现了无穷可分分布，使一个处理整个理论的新的简单的方法成为可能的了.这 
个新方法(仍以傅里叶分析为基础）同样应归功于列维 (1937). 多勃林 ( Doblin ) 对吸 
引域所作的精辟的分析 (1939) 激发了人们对此理论的 兴趣. 他的准则首次涉及了 
正则变化函数.虽然许多作者作了改进工作并得到了新的结果，现代理论仍然带有 
这个开创性工作的痕迹.第18聿包含用古典傅里叶方法对此理论所作的一个简洁 
的处理方法，而第9章则用一种直接方法讨论了同一理论，这种方法与马尔可夫过 
程中的现代方法是一 致的. 卡拉马塔 （ Karamata ) 的正则变化函数理论的系统利用， 
使许多准则的极大简化和统一成为可能•在 8.8 节和 8.9 节中给出了这个理论的一 
个改进了的形式. 

6.2 例 

例 （ a ) 期望为0的正态分布是严格稳定的，且 c „ = v / H . 

例 （ b ) 具有任意位置参数的柯西分布有密度 
1 c 
n C 2 + (x — v ) 2 ' 

卷积性质 2.4 节 (4.6) 表明，它是稳定的，且 a = 1. 

例 （ c > 满足的德定分布.分布 

F(x) = 2[1 - «n(l/v/x)], * > 0 (2.1) 

® 柯??提到过对称稳分布的傅里叶变换，但是它们碥实对应于*率分布这个事实并不明 fi . 波利 
亚对 a < 1的情形解决了这个问题 . 6.2 节« ( d ) 的* 尔特斯马克 ( Holtsmark ) 分布是天文学家 
们所熟知的，但数学家们却不知道. 



的密度为 

/(I)= ^ e_1/2<x>, * >0 - (2 . 2) 

[对于 a ： < 0,/(®) = 0.] 这是一个严格稳定分布，其正规化常数为 c „ = n 2 . 

这可以利用初等积分法来证明，但是把这个断言作为 F 有吸引域这个事实的 
推论是更可取的.实际上，在对称随机游动中，设 S r 是随机游动第 r 次回到原点 
的时刻.显然， S r 是 r 个独立同分布随机变量（逐次返回之间的等待时间）之和.我 
们在第1卷 3.7 节 (7.7) 的末尾证明了 

P {5 r < r 2 t } -♦ F ( i ), r -* oo . (2.3) 

因此 F 有一个吸引域，从而是稳定的.1在例 （ e ) 中继续讨论 .] 

例 （ d ) 恒星的引力场(霍尔特斯马克分 布). 用天文学的术语来说，问题是计算恒 
星系对一个随机选择的点 O 的引力的 a ; 分 M . 基本思想是要把恒星系作为一个具 
有“随机变化的质鲎”的点组成的“随机集合 体”. 利用泊松分布等术语可以把这些 
概念精确化，但是幸好我们所讨论的问理不需要什么梢确慨念. 

我们约定把恒星系的密度作为一个自由参数来处理，并设表示密度为 A 的 
恒星系的引力的: r 分鸶. 我们来求这种分布的可能 类型. “随机恒星集合体”的直观 
概念要求，两个密度为 s 和 t 的独立集合体可以结合成一个密度为 s + t 的集合体. 
从概率上讲，这相当于假定，两个与 X ,和；有相同分布的独立变董之和与 X s+t 
有相同的 分布. 我们把这个假定用符号表示为 


X , + X t ^ X . +t . 


(2-4) 


考虑到密度从1变为 A 相当于长度单位从1变为 1/^ A , 以及引力与距离的平方成 
反比，我们可以看 出不和 tiX 1 应当有相同的 分布. 这意味着所有的不的分布的 
不同之处仅在尺度参数上，且 （2.4) 化为带有 a = !的 (1.8). 换句话说， 的分布 
是对称穗定的，指数为 1可以证明，只存在一个这样的分布(如果两个分布仅仅是 
尺度参数不同，那么把它们看作为一个分布).因此，我们没有利用高深的理论而解 
决了我们的问题.天文学家霉尔特斯马克利用另外一种方法得到了一个等价的答 
案（见习题 7), 特别值得注意的是，这个结果是在列维的工作之前得到的. 

例 （ e ) 布朗运动的首次通过 时间. 我们从一维扩散过程的概念开始，即假设增世 
AX « + f )- Jt ( s ) 对于不相交的时间区间是独立的，而且它有方差为 f 的对称正态分 
布. 通常假设轨道是连续地依赖于时间的•如果 X (0) = 0,那么存在一个这样的时刻 
T a , 使质点在这个时刻首次到达位置 a > 0. 为了导出分布函数 F a { t ) = P { T „ ^ t >, 
我们注意到，可加过程具有完全无后效性（强马尔可夫 性). 这表示时刻: T a 与时刻 
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Ta + t 之间的横坐标的增 M X(t + T a )- a 与在 r a 之前的过程是独立的.为到达位 
置 a + b > a , 质点必须首先到达 a . 我们断言，在到达 a + b 之前的剩余等待时间 
T a+b - 7 1 。与 r u 独立，并且与有相同的 分布. 换句话说， F a irF b = F a + b . 但是， 
转移概率只依赖于比 x 2 /t, 因此—定和有相同分布.这说明诸分布凡的 
不同之处仅在尺度参数上，因而它们是旗定的，指數为 a = l 

这个以因次分析为基础的论证证明了痒次通过分布的稳定性，但没有推导出 
明显的表达式.为了证明 F 和例 ( c ) 中的分布重合，我们利用一个以对称性为基础的 
推理(所谓的反射原理).由 T 假设轨道是连续的，所以只有当在某个时刻 r a < t 轨 
道穿过水平线 a 时，事件 { X ( t ) > a } 才可能发生.若 r B = T < t 则 X ( r ) = a .由 
对称性， X(t)~ X(t) > 0的概率等于 I 因此， 

P { T 0 <«} = 2P{X(t) > a } = 2[1 - JH ( a / Vt )], (2.5) 


此式等价于 (2.1). 

例 （ f ) 二维 布朗运幼的蓄中点， 二 维布朗运动是由一对独立的一维布朗运动 
( X ( t ), y ⑴)构成的.我们感兴趣的是轨道首次到达直线 a : = a > 0的点 ( a , Z a ). 和上 
例一样,我们注意到，轨道只有在通过直线 x = a 之后才可能到达直线 x = a +6> o ； 
取 ( a , Z 0 ) 为新原点，我们断言， Z a + b 和两个与 Z a 和 Z b 有相同分布的独立变觉之 
和具有相同的分布.类似地，可证和 ciA 有相同的分布，因此 Z a 的分布是对 
称稳定的，指数为 a = l . 只有柯西分布满足这些条件，因此首中点 Z a 服从柯西分 
布. 

这个有启发性的因次分析没有确定尺度 参数. 为了把它明确地计算出来，注意 
Za = Y{Ta), 其中 r a 是首次到达直线 x = a 的 时刻. 它的分布已在 (2.5) 中给出， 
而^⑷有一个方差为 f 的正态密度.由此推出，的密度为® 

roo e -Jx a /t ae-i« a /« a 

Jo ~ tQ ^' «( a 2 + x *) - (26) 

(我们这里得到了过程的从属关系的一个例子，我们将在 10.7 节中再回来讨论它 .） 
例 （ g ) 经济学中的穗定分布.芒德布罗 （ B . Mandelbrot ) 利用与上面两例中的因 
次分析有关的论证证明了，各种经济过程（特别是收益分布）服从稳定（或“列维 - 
帕雷托”） 分布. 到现在为止，这个在经济学家中引起广泛注意的有趣的理论的威力 
应归功于理论的论证而不是归功于观察.决于这个分布的尾部与许多（从城市的大 
小到单词的频率）经验现象的明显拟合，见 2.4 节 （ h ).] 

①利用代换 + o a )/ t 可把被积函#化为 e -». 
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例 （ h ) 乘积. 在带有不同指数的稳定分布之间有许多奇特的关系.最有趣的一个 
可用下面的命题形式 给出. 设 A •和 F 分别是具有特征指数 a 和的严格稳定的 
独立变量.设 y 是一个正变量（从而/3 < 1). 乘积的分布是特征栺数为 a /3 
的穗定分布， 特别地，正态变量与例 （ c ) 中的稳定变童的平方根的乘积是一个柯西 
变量. 

这个断言可以作为关于从属过程的一个定理的简单推论① [10.7 节例 （ c )]. 而 
且，容易用傅里叶分析来验证它 （17.12 节的习题9>,且对于正变量，也可以用拉普 
拉斯变换来验证它【13.7节 ( e ) 和 13.11 节的习题 10]. 


6.3 R 1 中的无穷可分分布 

定义1 称 F 是无穷可分的，如果对于每个 n , 都 存在一 个分布 F „, 使 F = G *. 

换句话说®,当且仅当对于每个 n , F 可以表示为 n 个具有共同分布的独 
立随机变量之和 5„ = X 1 ,„ + ... + X „,„ 的分布时， F 是无穷可分的 • 

这个定义在任意维空间中都成立，但是目前我们只讨论一维分布，应该指出， 
无穷可分性是一种类型的性质，即 F 以及与 F 仅差一个位置参数的分布都是无穷 
可分的.稳定分布是无穷可分的，可以通过 F „ 与 F 只差一个位置参数这个事实来 
区分. 

例 （ a ) 由 2.2 节 (2.3) 卷积的性质，所有的 r 分布(包 括相数分布） 都是无穷可分 
的•在第1卷 12.2 节 ( e ) 中巳证明，这对于它们在离散情形的相应分布， “负二项分 
布” (包 含几何分布） 也是正确的. 

例 （ b ) 泊松分布和复合泊松分布都是无穷可 分的. 实际上，所有的无穷可分分布 
都是复合泊松分布的极限. 

例 （ c ) 与贝塞尔函数有关的 2.7 节 (7.13) 分布是无穷可分的，但这决不是明显的. 
见 13.7 节例⑷ • 

例 （ d > 集 中在一个有穷区间上的分布 F 不是无穷可分的， 除非它集中在一 点上. 
实际上，如果以概率1有 | S „| < a , 那么 | X fcin | < an - 1 , 从而 Vax ( X fc , n ) < o 2 n - 2 . 
因此， F 的方差 < a 2 ^ 1 . 所以它等 于零. ► 

回到定义1,我们来考虑，如果去掉 X k , n 有相同的分布这个要求，而只要求对 


①为了以最少的计算作直接 ft 证,通过首先计算在绝定 Vi = 1 /丨和 妁=於的条件下 Z = X X ^TT+ 
x , 的条件分布来求 Z 的分布 .Z 的分布是 Vl +y 3 的一个函数，变置代换 u = W + W ,t.= 

Vi-OT 表明它与两个被加数的分布只金一个尺度 因子. 对于 n 个类似项之和可作同样的计算. 

® 不言而喻，随机变量 X kt „ 只是为了使记号更简单更直观而引进的.对于囲定的71,假设变量 
Xi, n , --,X n ,„ 是相互独立的，但变童和 X fc ,„ (其中 mjtn) 不一定定义在同一概率 
空 间上. （换句话说，和 X fc ,„ 的联合分布不一定存在 .） 这个注一般也适用于三角形阵列. 
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于每个 n , 存在 ri 个分布巧,使得 

F = F 1< n ir -- kF n , n , (3.1) 


那么将会发生什么情况. 

这种一般化导致一种新现象，我们最好用例子来说明. 

例 （ e ) 如果 P 是无穷可分的，1/是任意的，那么 G = U - kF 可以写成 (3.1) 的形 
•式，其中 G,, n = U , 并且所有其他的 G fc , n 都等于 F n _,. 这里第一个分景所起的作 
用与所有其他分贵所起的作用完全不同. 

例 （ f ) 考虑一个相互独立的随机变 M 的收敛级数 X = ^： X k . X 的分布尸是 
X U X 2 , …， X n - i 的分布与剩余变* ( X „ + X n+1 + .--) 的分布的卷积，因此 F 具 
有 (3.1) 的形式.我们称这种分布为无穷卷积，以后要对它进行研究 .1.11 节例⑷ 
表明，均匀分布也是这样的分布. ► 

这些例子的显著特点是单个分婧对 S „ 的贡献是非常重要的，而在分童 
有相同的分布的情形，每个分 M 的贡献趋 T 零.我们希望把无穷可分分布与包含 
*1^ 多小分董”的曲型极限定理联系 起来. 为此，必须附加下列要求，即芊个变童 
X k , n 在下述的意义上是渐近可忽 略的： 对于每个 e > 0,当 n 充分大时， 

P {|^ fc,nl > «} < £ > (*： = 1, •••,«). (3.2) 

利用 8.2 节的术语，这表示心，„对*=1，…, n 依概牟一致地超于零. 这种类型的 
变 M 系经常出现，为了方便起见，我们给它们起一个名称. 

定义2 所谓一个三角形阵列指的是这样一个二重随机变量序列 { J > f fc , n }(fc = 1, •••,«,« 
1,2,--),使得第 n 行的变量&,„，…， X „,„ 是相互独立的. 

称此阵列为一个零阵列(或有渐近可忽略的分量)，如果 (3.2) 成立. 

更一般地，可以考虑第 n 行含有 》•„ 个变世的阵列，其中 — oo . 这种一般化 
得不到多大收获.（见习题 10.) 

例 （ g ) 设 { Xj } 是一个独立同分布的随机变 M 序列，= & +…+ 正规 
化了的序列 Sna - 1 表示一个三角形阵列的第 n 行之和，其中 X k , n = Xna - 1 . 如果 
o „ oo , 那么这个阵列是一个零 阵列. 在第1卷 6.6 节中推导泊松分布时，考虑过 

一个不同类型的阵列. ► 

在第9章和第17章中，我们将证明一个值得注意的事实，即一个零三角形阵 
列的行之和的极限分布（如果它存在）是无穷可分的.只要渐近可忽略条件 (3.2) 
成立，那么不管分量 X k , n 是否具有相同的分布，上述断言都成立，并且在（3.1>中 
可以把等号换为极限 符号： 无穷可分分布类与零三角形阵列的行和的极限分布所 
成的类重合. 
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例 （ h ) (关于 应用的例子) 真空管中的散粒故应. 下列随机过程的变形和推广出现 
在物理学和通讯工程中 • 

我们打算分析由于到达阴极的电子的数目的随机起伏而引起的电流的起伏.假 
设电子的到达构成一个泊松过程，一个到达的电子产生一个电流，其强度在 a ： 个 
单位时间以后为 J (; c ). 于是在时刻 f 的电流强度在形式上是一个随机变量 

X(t) = f^I(t-T k ), (3.3) 

fc=i 

其中 A 表示在 t 之前到达的电子的到达时刻.（换句话说，变量- 
r 2 ，…是 相互独立的，且有共同的指数分布 .） 

用随机过程的方法对和式 (3.3) 作直接分析是不难的，但是利用三角形阵列 
分析和式 (3.3) 这种较笨的方法有助于直观 理解. 把区间分成端点为4 = 
«-姑(其中*: = 0,1，".）的小子区间.由泊松过程的定义，区间对和式 (3.3) 
的贡献相当于一个以概率1 - M 取值0,以概率 aft 取值 - t *) 的二项随机变 
贵. 这个变贵的期望为 ahl(kh), 方差为 ahil-ah^ikh). 我们取/« = 1/ v / n , 作一 
个三角形阵列，其中 X k , n 是区间 t ^ TtTT 的贡献.于是行和的期望为 ah^Iikh), 
方差为 ah(l-ah)J：I a (kh). 如果级数 （3.3) 有意义，那么行和的分布应趋于 X(t) 
的分布，因此我们应当有 

E(X(t)) = a I{s)ds, Vai(X(t)) = a j I 2 (a)ds. (3.4) 

容易用三角形阵列理论来验证这些 结论. 我们称关系式 (3.4) 为康贝尔 （ Campbell ) 
定理.现在看来它并不高深，但是它是在1909年得到证明的，这比系统的理论的 
出现要早几十年.在系统的理论出现时，对它巳经给出了许多出色的证明了.（参阅 
8.10 节中的习题 22 和 17.12 节中的习题 5 . ) 

例 （ i ) 占綫问題. 上例的变形可以 说明它 的可能的推广类型.考虑一个有无穷多 
条中继线的电话局.打往电话局的呼叫形成一个泊松过程，每接到一个呼叫就把它 
接到一个空闲的中继线上.占用时间有共同的分布 F ; 照例假设它们与呼叫的到达 
过程独立，并且相互独立.在时刻 f 占线的数目是一个随机变量 X ( t ), 其分布可以 
用三角形阵列 的方法 导出.像在上例中那样，我们把 旧 分成 n 个长度为 A = «/« 
的小区间，并用 X k , n 表示在 n - Ah 与 n - （fc - 1)/»之间开始并在时刻 t 继续进 
行着的会话的次数.当 n 很大时，变量 X k , n 实际上只取值0和1,取1的概率为 
afe[l - F{kh )]. 于是 的期 望是这些概率 的和， 取极限我们可以得到， 占线的数 
目的期望为 ^ 

E ( X ( t )) = aj [1 - F ( s )] ds . (3.5) 
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注意，这个积分等于占用时间的期望. 

关于历 史的注无穷可分分布的概念 可追* 到 B . de 菲内蒂 (1929). 科尔莫戈罗夫 (1932) 
求出了具有有限方差的无穷可分分布的傅里叶变换，列维 (1934) 求出了一般的无穷可分分 
布的傅里叶变换，他还用随机过程的观点讨论了这个问题.所有后来的研究都受到了他的 
开创性工作的强烈影响. 1937 年，费勒和辛钦独立地给出了一般公式的纯分析 推导. 这两 
个作者还证明了，岑阵列的极限分布是无穷可分的 • 

6.4 独立增量过程 

无穷可分分布与独立增量过程有密切的 联系. 所谓独立增量过程，捎的是这样 
一个依赖于连续时间参教 t 的随机变量族久⑴，使得对任一有限集合 h < t 2 < 
…< 增量 x [ t k+x ) - x ( t k ) 是相互独 立的. 在这个时候，我们不需用到随机过 
程 理论； 我们只说明，如果某些现象可以用概率论方法描述，那么理论将导致无穷 
可分分布.在这种意义上.我们在第1卷 17.1 节和 3.8 节例 （ a ) 中考虑了特殊的独 
立增撤过程.我们只讨论数值变 M X ( t ), 虽然这个理论可以搬到随 机向量 上去. 

称过程具有平穗增量，如果 A -(5 + «)- A -( S ) 的分布只依赖于区间的长度 t 而 
不依赖 T 

我们用》+ 1个等距离的点 8 = t 0 < tl <---< t „ = a + t 来划分区间 8,8 + t , 
并设 x k , n = X { t k ) - X ( t k . x ). 具有平稳独立增嫩的过程的变童 G - x ( 8 ) 是 
n 个独立同分布 的变贵 X k , n 之和，从而 + t )~ A •⑻具有无穷可分分布.我们 
将看到，其逆也是正确的.事实上，为使定义在 t > 0上的单参数概率分布族 Q t 可 
以作为一个具有平稳独立增世的过程中的 X(a + «)- A -( S ) 的分布，当且仅当 

Q»+t = Q»irQu s,t > 0 . (4.1) 

一个满足 (4.1) 的分布族构成一个半群（见 9.2 节).每个无穷可分分布都可作为这 
种半群的元索(其中 f > 0是任意的). 

在讨论非平稳的情形以前，我们来考虑一些典型例子. 

例 （ a ) 复合泊松过程.对于任意的一个概率分布 F 和 a > 0, 

Qt = e - at f ^~ F k * (4.2) 

fc=o 

定义一个复合泊松分布.容易验证， (4.1) 成立. 现在假设 Q t 表示一个具有平稳独 
立增量的随机过程中的 X ( t )- X (0) 的分布.当 F 集中在点1上时，这个过程化为 
通常的泊松过程， (4.2) 化为 

P { A ■⑴—X ⑼ = n } = (4.3) 
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一般的模型 (4.2) 可以用这个特殊的泊松过程解释如下.设 ri , y 2) -- 是一列具 
有共同分布 F 的独立变量，又设 N(t) 是一个满足 P{N(t) = n } = e - Watr / n ! 的 
纯泊松过程的变童，而且与 V fc 独立. 那么 (4.2) 表示随机和 vi + --- + y w ( t ) 的分布. 
换句话说，对于泊松过程的第 n 次跳跃，有一个作用 y „ 与之对应， X ⑴ _ X (0) 表 
示发生在旧中的作用之和.在 2.7 节中研究过的随机化了的随机游动是一个复合 
泊松过程，其中 h 只取值 ±1. 经验上的应用将在本节的末尾举例说明. 

例 （ b ) 布朗运动或维纳-巴舍利耶 过程.这里 X (0) = 0 ( 过程从原点开始)，增 M 
X(t + a)~ X(e) 服从期望为0,方差为 t 的正态分布.维纳和列维证明了，这个过 
程的样本函数是以概率1为连 续的， 在所有的无穷可分分布中只有正态分布具有 
这种特性. 

例 （ c ) 穗定 过程. 对于严格稳定分布来说，关系式 (1.8) 只是重新叙述一下关系 
式 （4.1)( 其中 Q t (x) = Rir-^x)). 因此，这个分布定义了一个具有平稳独立增1： 
的过程的转移概率；对于 a = 2, 此过程化为布朗运动. ► 

这个理论的主要定理（见第9章和第17章）说明， (4.1) 的最一般的解 （从而 
最一般的无穷可分分布)可以表示为某一列速当的复合泊松分布的极限. 由于例 （ a ) 
和例 （ b ) 在形式上差别很大.所以这个结果是出人意料的. 

即使在非平稳的独立增 M 过程中， + s )- X(t) 的分布也可作为三角形阵 
列 {Xk,n} 的行和的分布出现，但是为保证 （3.2) 成立，必须附加一个较弱的连续 
性条件•例 （ e ) 将说明这种必 要性. 在一较弱的限制下，只有无穷可分分布可作为 
X(t + «)- X ( t ) 的分布出现. 

例 （ d ) 操作 时间. 时间尺度的简单变化常常可以把一般的过程化为比较容易处 
理的平稳 过程. 给定一个连续的增函数¥>,我们可以把变董 X ( t ) 变换成 y ( t ) = 
显然仍具有独立增贵性，并且适当选择 R 可使新过程有平稳的增贵.在 
实际中，这种选择通常是由事物的本质所决 定的. 例如，在电话局中，没有人会把 
夜间一小时与白天的忙碌的一小时相比较，而使用使得单位时间内的平均呼叫次 
数保持不变的可变时间单位来测董时间却是很自 然的. 此外，在不断增加的保险业 
务中，赔偿要求加速地发生，但是这种不平稳性可以通过引入一个测童赔偿要求的 
频率的操作时间来消除掉. 

例 （ e ) 经验上的应用. 很多的实际问埋可以化为复合泊松过程.这里有几个典型 
的例子 ■ ⑴由于汽车事故、火灾、雷电等引起的累积损失，关 于对集体風險 理论的 
应用，见6. 5 节例⑷.⑼一条专 捕某几 种鱼的渔船的捕鱼贵（内曼 （ J . Neyman )). 
( iii ) 由降雨鲎和用户的需要撤决定的水库的蓄水量 •（ iv ) 河底的石头 是这样长时间 
地处于静止，以致于它的逐次位移实际上是瞬 时的.在时 间区间 P 内的总位移可 
以作为一个复合泊松过程来处理.（首先被爱因斯坦 （ A . Einstein Jr .) 和 G . 波利 
亚用不同的方法讨 论过. ）( v ) 电话呼叫， 或到达某服务机构的顾客.在适当的条件 
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下，在时间区间旧内到达的顾客所需要的总服务时间是一个复合泊松过程.这个 
过程的显著特 点是： X ( t ) 的值在时刻 t 是不能由观察得到的，因为它依赖于未来 
的服务时间 .（ vi ) 关于因碰撞引起的物理质点的能量变化.见 10.1 节例 （ b ). ► 

*6.5 复合泊松过程中的破产问题 


设 X [ t ) 是一个复合泊松过程的变童，即在长度为 * 的时间区间上 的增设 x ( t + 
a ) - X («) 服从 (4.2) 的概率分布 Q t . 设 c > 0和 2 > 0是固定的.所 谓破产 指的是 
事件 

{ X ( t)>z + ct }. (5.1) 

我们把 c 看作一个常数，把 2 > 0看作一个自由参数 ，用 R ( z ) 表示“破产恒不产 
生”的 概芈.我们将从形式上 证明， 如果问题有意义， 那么 R ( z ) 应当是泛函方程 
(5.2) 的非增解. t 先给出几个例子来说明可以应用我们的问题的种种实际情形. 

例 （ a ) 集体风险理论 这里 X ( t ) 表示在时间区间町内保险公司收到的赔偿要 
求的总数.假设賠偿要求的出现服从一个泊松过程，各个賠偿要求都服从分布 
从原则上讲，这些赔偿要求可以是正的或负的.（例如，死亡可以使保险公司免付偾 
务，增加储金 .） 在实际中，发展中的保险公司将以与总收入的保险费成比例的操 
作时间来测 请时间 （见 6.4 节例 （ d )). 于是可以假设，在不出现賠偿要求时，储金以 
固有的速度 c 增加.如果 2 表示在时刻0的初始储金，那 么公司 在时刻 t 的总储金 
由随机变货 ：2 + ct - X ⑴表示，储金为负即破产 • 

例 （ b ) 大型 设备. 一个理想中的水库由河水和雨水以固定的速度 C 供水.在随机 
的时间区间中，水库的放水童为 X U X 2 ，…. 可以应用复合泊松模型，并且如果 z 
表示在时刻0的初始莆水埔，那么只要在时刻《以前不发生破产 ， z + ct - A ■⑻就 
表示在时刻 t 时的蓄水关于有关问理的大 fi 文献，见本书末尾所列的专著. 

例 （ c ) 病人诊病的时刻表 .® 我们约定把医生给他的 病人看 病的时间看作是服务 
期望为 cr 1 的指数分布的独立随机 变量. 只要治疗不间断地继续下去，已被治疗的 
病人的离开服从普逋的泊 松过程 •设 X ⑴表示在时间区间 P 内离开的人数.设在 

• 本节讨论--个特殊的》题.它有很大的实用价值，但在本书除了几个用新方法处理它的例子外，没 
有用到它. 

①有很多文獻讨论过这个（由卢布德格 （ F . Lundberg ) 开®的）理论.关于比较近代的研究，见 H . 
Cramer , On some questions connected with mathematical risk, Univ . Calif . Publications in 
Statistics , vol . 2, no . 5(1954) pp . 99-125 .在 11.7 节例 （ a ) 和 12.5 节例 （ d ) 中用初等方法得 
到了克拉美渐近估计（克拉美是用髙深的 维纳- * 普夫 ( Wicner - Hopf ) 方法得到 的). 

® R . Pyke , The supremum and infimum of the Poisson process, Ann . Math . Statist ., vol . 
30(1959) pp . 568-576. 毕克 （ PykeKi 讨论了纯泊松过程，但得到了更精确的结果（用不同的方 
法). 
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时刻 0( 开始办公时)有2个病人在等待，以后，新的病人在时刻 
到来. 只要 X{t) ^z + ct, 医生就不会 空闲. ► 

下面的形式论证导致一个确定输光概率 ii 的 方程. 假设样本函数的第一次跳 
跃发生在时刻 T , 并且跳跃度为 rr . 因为破产恒不发生，所以一定有 a ： <2 + CT ■，并 
且对于所有的 t > T, 增 M •⑷ 一 a:<z-;c + ct. 这个增量与过去独立，因此后一 
事件的概率为 R(z-x + ct). 对所有可能的 t 和 a : 求和，得 

R(z) = f ae~ aT dr f R(z + cr - x ) F {< Lc }. (5.2) 

Jo J-oo 

这就是所求的方程，但可以把它化简.利用变 M 代换 s = z + cr , 可得 

R(z) = - f°° e~^ c)l - x) ds [ 3 R(s-x)F{dx}. (5.3) 

C Jz J—oo 

因此，是可微的，通过一个简申-的微分可得最后的 积分- 微 分方租 

If(z) = -R(z) -- f Z R(z- x ) F { da :}. (5.4) 

c c 

注意，由定义知，当《 < 0时， R(s) = 0,因此右边的积分是卷积我们将在 
6.9 节例⑷、 11.7 节例⑷和 12.5 节例 （ d ) 中再来讨论 (5.4). 

6.6 更新过程 

更新理论的基本概念已经在第1卷第13 章 中讨论循环事件时引入了.我们将 
会看到，连续时间参数的引入依赖于记号的改变，而不是依赖于概念的改变.循环 
事件的显著特点是，逐次等待时间: T * 是具有共同分布 F 的独立随机 变撤； 第《次 
出现的时刻由下列和式给出> 

5„ = Ti + --- + T n . (6.1) 

根据约定，= 0,把0看作是第0次出现. 

‘即使在依赖于连续时间参数的随机过程中，也经常可以看到形如 (6.1) 的时刻 
的序列.在这种情形下，可以用简单的方法得到非常深刻的结果.从分析上讲，我 
们只涉及到独立正变童的和，引入术语“更新过程”的唯一理由是在讨论其他过程 
时它经常出现以及下面的不言而喻的 含义： 我们用到了更新方程这个强有力的工 
具①. 

①关于循环亊件的更复杂的一般化，见 J. F. C. Kingman, The stochastic theory of regenerative 
events , Zeitschrifl Wahrscheinlicb-keitstheorie, vol.2 (1964) pp. 180-224. 
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定义 1 称随机变量序列 {5„} 构成一个更析过程，如果它具有形式 (6.1), 其中 
T fc 是独立同分布的随机变量，它们的共同分布 F 满足 ®_ F (0) = 0. 

由于变量是正的，所以即使积分发散也所以记 M = E (: T fc )( 在发散的情形下 , M = 
oo ). 我们称期望为平 均循环时间， 与在类似的情况下一样，是变量及出现在某 
个随机过程中，还是序列本身确定我们的概率空间，对目前的讨论没有影响. 

在大多数(但不是所有的)应用中，可以把乃解释为“等待时间”，那么就可称 
S n 为更析（或再生)时刻 • 

直观上似乎很明显，对于一个固定的有限区间/ = W 属于 J 的更新时刻 
S n 的个数是以概率1为有限的，从而是一个完全确定的随机变 M iV . 如果称事件 
{ S n €1} 为 “成功”，那么 AT 是在无穷多次试验中成功的总次数，它的期望等于 

叩} = f ； P{Sn €/} = f ； F n *{ I }. (6.2) 

n =0 nsO 

为了研究这个测度，我们照例引入它的分布函数 

U { x ) = f ^ F n *{ x ). (6.3) 

不用说，当 a ： < 0时， U ( x ) = 0,但是1/在原点上有一个质憊为1的原子. 

在第1卷第13章中研究过的离被情形中，测度 C / 集中在整 数上： 叫表示有 
一个 s n m - k 的概率.因为这个事件只能发生一次，所以也可以把 M 解释为使 
S n = k 的 n 的平均个数.在目前的情形下，应当把 U { I ) 解释为期望而不应当解释 
为概率，因为亊件€ /} 可以对许多 t * 发生. 

必须证明 U ( x ) < oo . 由集中在上的分布的卷积的定义，显然有< 
^( x ), 因此在几何学上， (6.3) 中的级数至少在使 F ( x ) < 1的每一点上收敛.还有 
分布集中在一个有限区间上的情形，但是这时存在一个整数 r , 使得< 1. 
满足 n = f ，2 f ，3 rv ••的各项组成一个收敛子级数，这癟含 (6.3) 中的整个级数的收 
敛性，因为它的各项单调地依赖于 n . 

与在离散情形一样，更新测度和下列更 析方程 有密切的联系 ■ 

Z = z + FirZ . (6.4) 

具体写出来就是 

Z { x ) = z [ x ) + J Z ( x - y ) F { dy }, x > 0, (6.5) 

①在原点有一个质霣为 p <1 的®子不会有多大彩响. 
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其中积分区间是闭的.实际上，可以把积分限换为 - oo 和 oo , 只要我们假设当 x <0 
时， 2(3：) = 2(*) =0. 我们将遵循这个约定 • 

关于更新方程的一个基本事实包含在下列定理1中. 

定理1 如果2是有界的，且当 Z <0 时，2 = 0,那么由 

z ( x ) = f z { x - y ) U { dy ] (6.6) 

JO 

定义的卷积 Z = Uirz 是更新方程 (6.5) 的一 个解. 不存在其他的在 =55^ 上等于 
聿且在有限区间上有界的解. 

证我们已经知道，定义£/的级数 （6.3) 对所有的 rr 都收敛.取它与 z 的卷积，可 
以看出， Z 在有限区间上有界且满足更新 方程. 两个这样的解之差满足 V = F - kV , 
从而对所有的 n 也满足 V = 但是，对于所有的而且如 

果 V 是有界的，那么对于所有的 ar , V (*) = 0. ► 

我们将在 11.1 节中再回来讨论更新方程，那里我们将研究 C / 和 Z 的渐近性 
质.（关于更新方程的一般形式，见 6.10 节 .） 

应当指出， [/本 身满足 

U ( x ) = 1 + j : U ( x - y ) F { dy }, x >0, (6.7) 

此式是更新方程在 2 = 1 时的特殊 情形. 这可以通过一个通常称为‘‘更斬论证”的 
常用的概率论证直接 看出. 因为我们把0当做一个更新时刻，所以闭区间 P 中 
的更新时刻的平均数 目等丁 • 1加上半开区间 f 中的更新时刻的平均数目.只有 
当 z 时，此区间才包含更新时刻；给定 v < a :, 在 g 中的更新时刻的 
平均数目等于 C/(；c - 1/).对 y 求和就得到 (6.7). 

更新过程的两个简单推广是有用的.首先，与瞬时循环事件类似，我们可以容 
许 有亏损 分布. 那么，亏* g = 1 - F ( oo ) 可以解释 为终止 概率.抽象地说，我们用 
一个被称为“死亡"的点来扩大实直线， r * 或是正数，或是为了引用方便， 
我们引入非正 式的： 

定义 2①除了 F 是亏損的以外，可终止的或瞬时的更析过租是普通的更析过程. 
我们把亏量 g = 1 - F ( oo ) 解释为终止概率 • 

为了一致起见，我们把0当做第0次更新时刻.过程在第 n 次更新时刻还没 
有终止的概率等于 (1 - q ) n . 当 n oo 时，它趋于 0. 因此，可终止过程以概年 
1 在有限时间内 终止. F "* 的总质量是 (1 - q ) n , 因 而更新时刻的平均数目等于 
U ( oo ) = q - 1 < oo . 这可以说成是过程达到的代数的平均数目 • < a ; 且过程在这 

个第 n 个更新时刻终止”的概率是 qF ^ x ). 因此，我们有 

①举例说明见 6.7 节例 （f), 关于推广见习《 4. 
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定理 2 在一个可终止更新过程中， gf / 是过程的持续时间（终止时的寿命）的正常 
概率 分布. 

第2个推广相应于延迟了的循环事件，是在于允 许初始 的等待时间有一个不 
同的分布.在这种情形下，我们从 ； j = 0开始给乃编号，因此现在有 5 o = T o ^0. 
定义3 称序列 S 0 ， S U … 构成一个延迟了的更靳过程，如果它具有形式 （6.1)， 
其中： Tfc 是相互独立的严格正（正常或亏损 变量， ， : T 2 ，.. •(但不包括 r 0 ) 是同分布 
的). 


6.7 例与问题 


像 ft 更新机组、计数器及人口增长等例子，可以明显的方式从离散情形中搬过 
来.然而，一个特殊的问题将导致一些我们将在以后讨论的有趣的问题. 

例 （ a ) 检验的# 论. 在自更新机组理论中，一部设备，例如一节电池，装置好以 
后一直工作，直到它坏掉为止.损坏后，它立即被同样的电池代替，这个过程不间 
断地继续下去.更新时刻构成一个更新过程，其中巧是第*个电池的寿命. 

现在假设通过检验来测定实际寿命：我们取一个在时刻 <> 0工作着的电池样 
本并观察它们的 寿命. 因为'是所有的电池的寿命的共同分布.所以我们可以希望 
这也适用于被检验的样本.但是亊实并非如此.事实上，对于指数分布情况只 
在宇句上与 1.4 节中的等待时间伴论有所不同.在 1.4 节中，被检验的对象的寿命 
有一个完全不同的分布. 对象在时刻 < 被检 验这个事实，改变了它的寿命的分布， 
并使其期望寿命 加倍. 我们在 11.4 节 (4.6) 中将会看到，这种情况在所有的更新过 
程中具有典 型性. 实际的含义是非常重要的.我们看到，无偏见的检验计划可能得 
到错误的结论，因为 我们实际观察的对象未必在总体中具有典型性. 曾经注意到的 
这种现象是容易理解的（见 1.4 节)，伹是它揭露了可能易犯的错误以及理论与实际 
之间的必然的相互作用.附带说明， 如果 我们决定检验在时刻 t 后装置的第一个对 
象，那么就不会出现麻烦. ► 

现在是引入更新理论中的3个有趣的随机变童的好时机.在上例中，所有3个 
变贵都涉及在时刻 t 工作着的电池，且可以用不言自明的术语来描述 • 剩余寿命， 
已度过的寿命和总寿命.正式的定义如下. 

对于给定的 t > 0,有唯一的一个（随机的）的下标使得 S Nt ^t< S Nt+l . 

那么 

(a) 剩余的等待时间是 5 We+1 -t, 即从 t 到下一次更新时刻的 时间. 

( b ) 已度过的等待时间是 t - Siv ,, 即在最后一个更新时刻以后所 经过的 时间. 

( c ) 它们的和 S Nt+1 - S Nl = T Nt+t 是包含时刻 * 的循环区间的长度. 



这种术语不是唯一的，可以随上下文而改变.例如，在随机游动中，可以称我 
们的剩余等待时间为区间？ 的首入点或首中点. 在上例中，我们用寿命一词表 
示等待时间.我们将在 11.4 节和 14.3 节中研究这3个变量. 

我们把泊 松过程 定义为一个循环时间 7} 服从同一指数分布 的更新 过程.在计 
多服务员和计数器问题中，自然要假设，要到来的业务形成一个泊松过程.在某些 
其他过程中，到达时刻的间隔是一个常数.为了把这两种情形结合起来，在排队论 
中通常引入具有任意的到达时刻间隔的一般更新过程 .® 

我们着手讨论与更新过程有关的相当一般的问题_我们仍用 F 来表示过程的 
基本分布. 

我们从所谓的“大间鵑的等待时间灰”开始_这里，一个循环时 间为乃 的更 
新过程，在第一次出现一个不包含更新时刻的长度为 S 的时间区间时停止，到此 
过程就终 止了. 我们来对等待时间 W 的分布 V 推导一个更新方程.由于 W 必然大 
于所以当 t < €时， V ( t ) = 0.对于 t X ,考虑两种互斥的可能性： C 或 

= 1/ <《.在第1种情形下，等待时间 W 等于在第2种情形下，过程重新开 
始，{州 < 0在给定 T 1= y 下的条件概率是 K ( t - 》)• 对所有可能性求和，得 

V ( t ) = 1 - + J ^ + V(t - y ) F { di /}, (7.1) 

当然，当 * < $时， V ( t ) = 0. 这个方程可化为标准更新方程 


V = z + G - kV , 

其中亏损分布 G 由下式 定义： 


( F ( x h * 

I m, 


(7.2) 


(7.3) 


且 

..f * < 《， 

*(*) = \ (7.4) 

I i-no, d 

最重要的特殊情形是满足尸 ( t ) = l - e - rt 的 泊松过程中的 间脒，其解 V 与 1.9 
节的覆盖定理有关.[见习题 I 5 和 I 4 . 2 节例 （ a ), 关于一种不同的处理方法见习题 
16.] 

①这个一般性有点令人误解，因为除了不按时刻表沿环行公路行驶的汽车外，很难找到实际例子.对 
这个 一般性 的误解是由事实非泊松输入通常也是非马尔可夫输入引起的. 
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经验上的应用的例子 

例 （ b ) 横 穿一个交通流 .® 汽车在一条单向行车道上以固定的速度行驶，逐次的 
通过形成一个泊松过程(或其他更新过程) 的一个 样本.走到路边的行人(或到达一 
个路口的汽车）一看到以后€秒钟（即穿过行车道所需要的时间）内没有汽车通过 
时，他就开始横穿行车道. 用灰表 示为实现一次穿过所需要的时间，即在路边的 
等待时间加上 t W 的分布 V 满足 (7.1), 其中 F ( t ) = 1 - e - 气[将在 II . 7 节例 （ b ) 
和 14.2 节例 （ a ) 中继续讨论 . 1 

例 （ c ) H 型盖革 ( Geiger ) 计 数器. 到达的质点构成一个泊松过程，每个到达的质 
点（不管是否被记录)都要把计数器关闭一段固定的时间$若一个质点被记录，则 
计数器将保持关闭的状态，直到出现一个不包含新的到达的长度为$的区间时为 
止.我们的理论适用于 关闲期的长度 的分布 V . (见第1卷 13.11 节习题 14.) 

例 （ d > 最大的观察循 环时闽 • 在一个基本的更新过程中，用&表示时刻 t 以前《出 
现的乃的最大值.为使事件 { Z t < 发生，当且仅当直到时刻不出现一个不包 
含更新时刻的长度为《的时间区间，因而用我们的记 号有： P { Z t > f } = V ( t ). ► 

出现在应用中的许多更新过程可以描述 为交替过程或二阶段过程， 我们可以 
根据上下文，称这两个阶段为主动的或被动的，自由的或关闭的、兴奋的或正常的. 
主动周期和被动周期相互 交替； 它们的持续时间是独立的随机变董，主动周期的持 
续时间服从一个共同的分布，被动周期的持续时间也服从一个共同的分布. 

例 （ e ) 由故障？ I 起的推迟.最简单的例子是由一部每次故障都引起一次推迟的 
设备的实际更换给 出的. （推迟可以解释为发现或修理的时间 .） 逐次的工作时间 
T u T 2 , - - 与逐次的停工时间 - - 相互交替，我们得到一个循环时间为 Tj+Yi 
的正常更新过程.这一个过程也可以看成是在上出现第一个更新时刻，循环时 
间为 Yj + T J+l 的延迟7的更新过程. 

例 （ f ) 失去的呼叫. 考虑这样一条中继线，使打来的呼叫形成一个到达时刻间隔 
的分布为 G ⑷ = l - e - rt 的泊松过程， 而所有 的会话持续时间是具有共同分布尸 
的独立随机变 M . 中继线或者是空闲的或者被占用，在占线期间到来的呼叫就失 
去了，并且对此过程没有影响.这样得到了一个二阶段过程，其循环时间的分布为 
F - kG . (见习题17及 14.10 节中的习题3和习题 4.) 

例 （ g ) 先为最后到者 眼务. 有时交替等待时间的分布不是预先知道的，应当根据 
其他的数据计算.作为一个例子，我们考虑一部数据处理机，其中新信息的到来形 
成一个泊松过程，因而闲期服从指数 分布. 处理在任何时刻到来的新信息所需要的 

①关于过去的文歒和它的（用不同方法讨论的）变形，见 J . C. Humer , The delay to pedestmins 
crossing a road, Biometrika , vol . 38(1951) pp . 383-392. 

® 更确切地说，如果 n 是使 S„_i < S n 的（随机）报标，那么 Z t = maxlTi ，…, rn — i ，幻•兰 

珀蒂 （ A . Lamperti ) 系统地研究了具有这种性质的变量. 
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时间都服从一个概率分布 G . 

忙期和闲期相互交替，但是忙期的长度依赖于对忙期中到来的信息的处理方 
式.在某些情况下，只关心最后的信息，于是新到来的信息立即被处理，而所有以 
前的信息都被抛弃了.忙期的长度的分布 V 应由更新方程来计算（见习题 18). 

例 （ h ) 盖革计數器 .在 I 型计数器中，每次记录后有一个固定长度为€的关闭 
期，在关闭期内到来的质点没有作用.这个过程与例 （ e ) 中所述的过程一样， 7) 服 
从指数分布， K 等于在 n 型计数器中，未被记录的质点的到达也使计数器关闭， 
除了巧 的分布依赖于基本的过程且应当根据更新方程 （7.1) 来计算外[例⑹】，情 
况是一样的. ► 

6.8 随机游动 

设 Ax , x 2 , ■ •是 具有共同分布 P 的独立随机变世，并且照例令 


So = 0, Sn = Xi + • • • + X n . 


(8.1) 


我们称&是一个作一般随机游动的质点在时刻 n 的位置.我们并没有引入新的理 
论性的概念, ® 只是为了得到过程 { S n } 的一个简单直观的描述，引入了一 个术珉 
例如，如果/是任一区间（或其他的集合)，那么称事件 { S „ e J } 为在 J 中的一次 
逗留，通过对给定区间7中的逐次逗留的研究，可以揭餺出负, S 2 , …的起伏的重 
要特征.我们将把指标 n 解释为时间参数，将谈及“时刻 n ”. 在本节中，我们将用 
逐次的记录值来描述随机游动的一 些惊人 特征.这些结果的用处将用 6.9 节中的应 
用来说明，另一种（独立的）处理方法将在 6.10 节中给出. 

嵌人更新过程 

称记录值发生在时刻 n > 0,如果 

Sn > Sj , i = 0, l ,- -, n - l . (8.2) 

对于一个给定的样本轨道，这样的指标也许不存在；如果它们确实存在，那么它 
们形成一个有限或无限有序序列.因此，我们可以说 （8.2) 第1次发生，第2次发 
生，…… • 它们的时刻仍是随机变童，但可能是亏 损的. 有了这些准备工作以后， 
我们现在就可以引入一些重要的随机变 M , 许多有关随机游动的讨论将以这些变 
量为基础. 

定义第 fc 个(上升）阶梯指标是 (8.2) 式第 fc 次发生的时刻.第 Jfc 个阶梯高度是 S „ 
在第 fc 个阶梯时刻的值.（两个随机变量都可能是亏损的 .） 

①我们在第1卷中曾考成过无穷随机*动的样本空间，但在那里我们必须通过明 fi 的极限过程来说 
明像光概率”这样的*念的合理性.现在由测度论知这些明显的取极 S 是合理的.（见 4.6 节 .） 
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把 （8.2) 式中的不等号改变方向，可用同样的方式来定义下降阶榉变量.① 
术语上升是多余的，只是为了强调或清楚起见才使用的. 

在样本轨道 ( So . Si , --) 的图像中，阶梯点作为图像达到空前的高度（记录值) 
的点出现.图 心1 表示一个趋向 - oo 的随机游动 { S n }, 它的最后一个正项是在 
n = 31处 . 5个上升阶梯点和18个下降阶梯点分别用•和。表示.关于一个带有 
柯西变量的随机游动见图 6*2. 



图 6>1 随机游动及与其相关的排队过程.随机游动 { S n } 的变量的期望为 -1, 方差 

为 16. 上升阶梯点和下降阶梯点分别用•和。表示.第7个阶梯点是 （26,16), 它 
大概是整个随机游动的最大值. 

[宇 母切 表示随机游动在那里第2次或第3次取记 录值； 这些是通过把 (8.2) 
中的严格不等号换为 > 所定义的弱阶梯点 .j 

在整个图形中， S „ 大于它的期望 - n . 事实上 ， n = 136是使< - n (即 
Si 35 = -137) 的第1个 指标. 这与这种 n 的期望等于无穷大这个事实一致. 

变量具有形式 X n = S 6 n -^ n , 其中变量激„和武是相互独立的，且 
分别是在1, 3, 5, T , 9和2, 4, 6, 8, 10上均匀分布的•在 6.9 节例 （ a ) 中，如果 
假设到达时刻间隔以相同的概率取值2, 4, 6, 8, 10 ,而脤务时间为1, 3, 5, 7, 9 
的概率都是则变量队是第 n 个頋客的总等待时间 . 的分布对点 ±2 fc - 1 
賦予概率 （5 - *)/25, 其中 * = 0, 1, 2, 3, 4. 

例 （ a ) 在“普通的”的随机游动中， F 有质量为 p 和 g 的原子1 和- 1 ,如果 
Q > P , 则上升阶梯变量是亏损的， 亏董是 p / g [见第1卷 11.3 节 （3.9)]. 第 fc 个阶梯 
高度必然等于 fc . 由于这个原因，第1卷只讨论阶梯时刻.第个阶梯指标是第一 

①把严格不等号换为 > 和<, Bf 得到弱阶掸指标.当基本分布是连读的时候，这个令人讨厌的区别 
是不必要的.在图 6>1 中，與阶禅点用宇母表示. 
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次在点 fc 逗留的时刻.它的分布已在第 1 卷 11.4 节⑷中求 出了； 在 P= | 的特殊 
情形的分布，已在第1卷 3.4 节的定理2中求出了. 

第1个阶梯指标负是第一次进入0^5的时刻，第1个阶梯高度冰 等予 S 巧. 
时刻负 以后的随机游动是整个随机游动的概率仿样.给定刃= «, 在时刻 fc>n 
上出现的第2个阶梯指标 a 仅依赖于 X „ +1 ，…,因此，第1个阶梯指标与第2 
个阶梯指标之间的试验次数是一个随机变童爲，为与负独立且与为同分布.由 
此可见，更一般地，苐 fc 个阶梯栺标和第 A: 个阶梯高度可以写成形式 


负+…十灵， jn+---+M, 


其中另和戈5是相互独立的随机变量，分别与 爲和冰 有相同的 分布. 换句话 
说，阶梯指标和阶梯髙度都构成（可能是可终止的)更新过租. 

对于可终止过程， S„ 趋向- oo 这件事在直观上是很明显的， S„ 以概率1达到 


强有力的 工具. 

例 （b) 明显的表达式•设 F 有一个由下式定义的密度 


/⑻= { 


abe ax 
a + b ' 
abe-^ 
a + b 


(8.3) 


这个随机游动有一个少见的特点，即所有有关的分布都可以明显地计箅出来.它在 
排队论中有很重要的意义，因为/是两个分别集中在0^5和二357上的指数密度 
的卷积.这表示X)可以写成两个服从栺數分布的正随机变量之差；10 = 

不失一般性，我们假设《1<&. 

上升阶梯高度戈！有一个密度 ae- 6 *; 这个变 童是亏 损的，它的亏量等于 （6- 
o)/6. 上升阶梯时刻的母函数为 b - Ma ), 其中 


2p(s) = a + 6— \/(o + 6) 2 — 4a6a. 


(8.4) 


亏量也是 

下降阶梯高度有一个密度 a ^{ x > 0 ), 下降阶梯时刻的母函数为 a -^ p { s ). 
在 a = b 的特殊情形，它化成1 - 这个母函数是在普通的随机游动（或掷硬 

币）中所熟 悉的. 味于证明和其他结果，见 12.4 节， 12.5 节和 18.3 节. 又见 6.4 节 
例 （e).] 
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6.9 排队过程 

研究各种与服务员、仓库设备、等待时间等有关的问题的文献^特别多.统一 
化工作巳取得了很大进展，但是许多小的变化遮盖了人们的视野，以致于只见树木 
不见林.新的一般方法的力量仍被低估.我们从以递推方式正式引入一个随机过程 
开始， 这种方式乍看起来有点不自然.例子将说明这种方式的广泛应用性；我们以 
后将会看到，可以用非常简单的方法得出深刻的结果.（见 12.5 节 .） 

定义 1 设 Ai , X 2 , •■是具有共同（正 常） 分布 F 的相互独立的随机变量.导出的 
排队过程是用下列递推方式定义的随机变量序列 - ： Wb = 0, 

w / iVn + X n+1 , 

Wn+1 = \o, 

简单 地说， w n+1 = ( w n + x n +1 ) U 0. 

举例说明见图 6*1. 

例 （ a ) —个服务员的# 队. 假设“顾客”到达一个“服务员”那里.到达形成一个 
到达时刻间隔0为 K … 的正常更新过程（到达的时刻是 o ， M,M +為,…， 
我们把顾客编上号0, 1, 2,…).对于第 n 个顾客，有一个相应的服务时间劣„，我 
们假设与到达时刻独立，并且是独立同分布的.服务员或者“闲着”或者 t 
着”，他在开始时刻0是闲 着的. 以后遵守下列规则.如果顾客在脹务员闲着的时候 
到达，那么服务员立即为他 眼务. 否则，他就加入等待队列（排队)，眼务员按到达 
的次序$不间断地为顾客服务，一直到队列消失，服务员变成空闲时为止.所谓队 
长指的是现有顾客（包括正被服务的顾客）的数目.第 n 个顾客的等待时间是 

①关于参考书，可 参阅书 末参考 文歒中 所列的专*.驀《单地*述这个》题的发展，并给出适当的 
评价是非常困 准的. 许多对新方法的发 展有贡 献的文章由于它们所9致的进展而变得过时了. I 嫌队 
论中的林徳莱 （ Lindley ) 积分方程 (1952) 就是一个例子 .] 另一些文章 W 由于它们讨论（有时是很 
复杂的）特株的问*而值得 注意， 但是在概述一鷇的理论时就没有它们的地位了.总的说来，关于 
这几个*埋的大*文献部强调 r 例子和各种变形，但没有注童到一 液的 方法.由于重复很多，所 
以很难说哪个 在前. 釅个在后.[例如，在 Stockholm 的一篇论文中 (1939) 把某一积分方程的解 
归功于费勒的未发表的讲稿 (1934). 但这个解现在以好几个人的名字命名 .1 关于历史可见肯达尔 
( Kendall ) 的两篇有独立意义的综述性论文 I Some problems in the theory of queues and Some 
problems in the theory of dams , J . Roy - Statist . Soc . Series B , vol . 13(1951) pp . 151-185 
and vol . 19(1957) pp . 207-233. 

® 通常，判达时刻间隔是一个常数或服从指数分布，伹现在流行的是允许任意的更新过程，见 6.7 节脚 
注 1. 

® 这个“样队的规律”完全与队长、忙期长度和类似的问顯无关.只有颖客本人能感觉到这些 规津的 
作用，其中“先为第1个 a 达者賑务”、“先为最后1个到达者賑务”和喺机选择”是极»措施.如 
果允许离开，那么整个惰况就改变了. 


Wn + ^fn+1 ^ 0, 
lV n + X„ +I <0. 
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从他到达时刻到他的服务开始的时刻所用的时间；顾客在服务员那里所用的总时 
间是 + (例如，如果最初几个眼务时间是4, 4, 1, 3,…，到达时刻的间隔 
为2, 3, 2, 3,…，那么编号为1, 2, ••• 的頋客加入了队长分别为1, 1, 2, 1，…的 
队列，且等待时间为2, 3, 2, 2, • ) 

为了避免像“一个顾客在另一个颃客离开的时刻到达”这样的意义不明确的 
话，我们将假设变 M 和風* 的分布4和 S 都是连续的.于是在任一时刻的队 
长都是完全确定的. 

我们着手设计一个用递推方式计算等待时间％的方案.根据定义，编号为0 
的顾客在时刻0到达闲着的 服务员 那里，因而等待时间是队= 0. 现在假设第 n 个 
顾客在时刻 t 到达，且知道他的等待时间他的服务时间从时刻 t + W n 开始，在 
时刻 t + Wn +£» n 终止.下一个頋客的到达时刻是如果 W n + a n < M , +1> 
那么他看到服务员是闲着的，并且如果 W n + - ^ n+1 > 0 ,那么他的等待时间 

为 W n+1 = W n + ^ n -^ n + l . 换句话说， 等待时间序列 { W n } 与下列独立随机变量 

■^n = ^ n—l Tl = 1,2, • ■ • , (9.2) 


导出的排过过程重合. 

例 （ b ) 存储设备与存货.为了使描述直观起见，我们利用水库(和水项)，但是这 
个模型同样也适用于其他的存储设备或 存货. 蓄水 M 取决于输入和输出.输入是由 
河水和雨水供给的，输出由需要贵所控制，但是只有当水库不空的时候才能满足这 
个要求. 

现在考虑在选定时刻0,71,乃,."的蓄水童 (1 >0，叭,恥,.... 用忍 表示 
中实际的供应董与理论（理想）的需要童之差，又设所有的变化都是瞬时的且集中 
在时刻 n . ra , ••- ±.我们从时刻0的州> = 0 开始. 一般说来，除非需要贵超过蓄 
水贵，否则 W ^ n+i - W n 应等于 X n+1 . 因此，％ 应当满足 (9.1), 所以只要理论上 
的净变化董 I * 是独立同分布的随机变 M , 则逐次的蓄水 * ■服从由{ X *}导出的排 
队过租. 

对于数学家（若不是对于用户）来说，问题是要找出使 X * 为独立同分布 F 的 
变量的条件，并求出 F 的可能 形式. 通常， t * 是等距离的，或者是泊松过程的一个 
样本，但是目前只要假设 T fc 形成一个到达时刻间隔为 M ，^， …的更新过租就够 
了. 最常用的樓型可以分成下列两种类型. 

⑴输入是以固定的速度 c 进行的，需要量乳是任意的.那么尤„ = 

我们应假设这个与“过去”; • _ -. Xn -! 独立.« 和武 独立这个通常的假设 
是不必要的< 我们没有理由说需要最風》和持续时间激„无关 .） 


①为简单起见，我们从空水库 开始. 调整到任意的初始条件都不会产生困难 t 见例 （ C )】. 
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( ii ) 输出是以固定的速度进行的，输入是任意的.把式和乳的作用交换一 
下，叙述是相同的. 

例 （ c ) 往返列车的排队 .® 每过1小时有一列有 r 个乘客座位的往返列车从车站 
开出.要乘车的人在车站上排队等待.每次出发时，队列中的前 r 个人上车，其余 
的留在等待队列中.我们假设，在列车逐次开出之间到来的乘客数目是独立同分布 
的随机变确，….设％是第 ri 次开出后等待队列中的乘客数目，且为了简 
单起见，设 Wb = 0,于是，如果+ ^ n + i ~ r 为正，则 W n+1 = W n + <+ i - r , 
如果％ + 不是正的，则 W n+ i = 0•因此，是由变董为 X n = s^ n -r 

的随机游动产生的排队过程 （9.1) 的变量. ► 

我们现在用变鼉 X * 产生的随机游动来描述排队过程 { W n }. 与在 6.8 节中一 
样，令洗 + + 并沿用关于阶梯变量的记号.为了便于描述，我 

们利用适合于例 （ a ) 中的服务员的术语. 

我们定义*/为这样的下标，使得负 >0,灸 >0,…， S «^>0, 但&<0.在这 
种情形下，编号为1,2, •••,»/- 1的顾客的等待时间为 = S„- U 
编号为〃的顾客第一个看到服务员是闲着的（第1个幸运的顾客).从他到达的时 
刻开始，这个过程作为整个过程的复制，重新开始 . ^只不过是第1个负和数的指 
标，即〃是第1个下降阶梯指标，我们将始终如一地用夕厂来表示它.因此，我们 
得到第1个 结论： 下降阶梯栺标对应于看到空闲服务员的幸运颖客•换句话说，幸 
运顾客到来的时刻构成一个具有与另同分布的循环时间的更新过程. 

在实际的情形中，变贵夕厂应不是亏损的，因为它的亏董等于顾客永远看不 
到空闲服务员的概率，并且以概率1有一个后面跟无究队列的顾客.事实上，当 
E (爲 } < E (地）时 ，名- 是正常的. 

现在设编号为1的顾客在时刻 r 到达.他的等待时间是 S v - i . )k 
而他离开的时刻是 T + 当眼务员空闲了 

siv 一 1 — S6v—\ — ~Su—\ ~ Xu = — Si/ 

个单位时间后，第1个幸运的頋客（编号为 《/) 在时刻 T +式 到达.但是根据定 
义， s v 是第1个下降阶梯高度当过程重新开始时，我们得到第2个结论《闲 
期的持续时间是与 _ j«r (下降阶梯髙度的循环时间)同分布的设立随机变量.换句 
话说，编号为 ^-+...+5；- 的顾客是第 r 个看到空闲服务员的顾客.在他到达的 
时刻，服务员已空闲了 - Jtr r - 个单位时间. 


① P. E. Boudreau, J. S. Griffin Jr. and Mark Kac, An elementary queuing problem, Amer. 
Math. Monthly, vol. 69(1962) pp. 713-724. 这篇文聿是为不具有本学科知识的外行人写的.虽 
然使用的叙述方式不同，但其计算巳包含在 12.4 节 W (c) 中了. 
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很清楚，在逐次的阶梯时刻之间，排队过程 { W „} 的困形的各部分和随机游动 
的困形的相应部分全等，但是排队过程是向上伸展的，因而从时间轴的点上开始 
(图 6-1). 为了用分析的方法描述这一点，我们用 [ n ] 表示最后一个小于或等于 ri 的 
下降阶梯 指标； 换句话说， M 是这样一个 （ 随机）指标，使得 [ n ] ，且 

5[„] ^ Sj, j ' = 0,1, •••,«. (9.3) 

这就以概率1唯一地确定了 [ n ] (因为的分布是连续的).显然， 

= 5„ - 5(„]. (9.4) 

如果我们以相反的次序考察变 M X u -,X n , 那么上述关系式将导致一个很重 
要的结论.为了简略起见， ^■X' l = X n ,- -,X' n = X l . 这些变童的部分和是 

S'lc = X’i + …+ X’ k = S n — S n -k, 

(9.4) 说明序列的最大项的下标是 n - [ fi ], 且最大项等于灰„.但是 
{X [，- ■■,X' n ) 的分布与 {X u ---,X n ) 的分布相同.因此，我们有下列基本定理. 
定理①排队变量的分布和基本随机游动{ X *}中的随机变量 

Af n = max [0, Si ，…， S „】 （9.5) 


的分布相同. 

我们将在第12章中讨论这个定理的推论.这里我们来说明，利用它可以把某 
些破光问题化为排队过程，尽管它们的外表不同. 

例 （ d ) 破产 问超 .在 6.5 节中，我们把破产定义为 “有一个 t, 使得 A ■⑴ > z+ct n 
这一亊件，其中 X(t) 是一个分布为 （4.2) 的复合泊松过程的变量.用 nm , …表 
示这个过程的逐次跳跃的时刻.既然破产发生，那么它在某个时刻也发生，因 
此只要考虑“有一个 n , 使得= X(r n ) - cr „ > 2 ” 的概率就行了.但是根据复 
合泊松过程的定义， A "( t „) 是 n 个具有共同分布 F 的独立随机变量 h 之和，而 
t „ 是 n 个独立的服从指数分布的变量成 之和. 因此，我们实际上讨论的是由变董 
X fc = n - c ^ fc 产生的随机游动 ，右 的概率密度由下列卷积给出： 

^°°e a < x -*)/ c F{d»}. (9.6) 

破产发生，当且仅当在此随机游动中，事件 {S„>2} 对某个《发生.因此求破产 
概率相当于在有关的排队过程中求变量的分布. 


①此定 理是坡 拉泽克 （F. Pollaczek) 在1952年首次赛晁提出的，斯皮策尔 （F. Spitzer) 在下列论文 


中用不同的方法讨论了它 ， The Wiener-Hopf equation whose kernel is a probability density, 
Duke Math. J, wl. 24(1957) pp. 327-344. 关于 Spitzer 的证明，见习題 21. 
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例 （ e ) 数值实例.当到达时刻间隔和服务时间分别服从期望为 1/ a 和 1/ b (其中 

o <6) 的指數分布时，我们就得到了最重要的排队过程.根据 6.8 节例 （ b ) 中描述 

的这种过程的特征，可以断言，第 TI 个顾客的等待时间有一个极限分布此分 

布在原点具有质量为 l - a /& 的原子，并且对 i >0 有密度期望等 

于 rTir - T - i hp 肪-气在这 # 

o(o - a ) 

情形下，闲期和到达时刻间隔有相同的分布（但在其他的排队过程中，情况不是这 
样). 

第1个发现计數器是空闲的頋客的号码 N 的母函數为 p («)/ a , 其中 p 由 (8.4) 
所定义.现在考虑从时刻0开始的忙期，即到服务员第一次变为空闲的时刻的时间 
间隔.这个周期从号码为0的顾客开始，随机变量 AT 又等于初始忙期中頋客的數 
目.由简单的计算可知，它的期望等于 b /(&- a ), 它的方差等于 a 6 ( a + 6)/(6- a ) 3 . 

最后，令 T 是忙期的持续时间.它的密度由 14.6 节 (6.16) 显式给出，其中 
cp = a,cq = b . 这个涉及到贝塞尔函数的公式不利于计算，但是可利用 14.4 节例 
⑷和 14.6 节例⑻中的用不同方法导出的它的拉普拉斯变换来计算 r 的矩.结果 
是 

Va,(r) = (a + l )^. 


在排队过程中，忙期和闲期相互交替，它们的期望分别是 l /( b - a ) 和 1/ a . 因 
此， （6_ a )/ a 是服务员的空闲时间的一种量度•更确切地说，如果 C / ⑴是直到时刻 
t 的空闲时间，那么*-咕(17⑷） (6 - a )/ o . 


表 6-1 



等待时间 

期斟 

1 1.6 

2.3 4 

9 

19 

(« 定状态） 

方差 

3 5.3 

10 24 

99 

399 

忙期 

期《 

方塞 

2 2.5 

12 25 

3.3 . 5 

63 255 

10 

1900 

399 

16 000 

每个忙期 

期® 

2 2.5 

3.3 5d 

44 200 

10 

399 

15 200 

的顒客数目 

方差 

6 15 

1700 


表中取平均服务时间为单位，因此 a 表示在一个服务时间内到达的顾客的期 
望 数目. 这个表还说明忙期的方差 很大. 因此，忙期的起伏很大是自然的.我们看 
出，在实际应用中，通常的对期望的依赖是很危险的.对于一个方差为255的忙期， 
期望为5这个事实没有什么实际意义. 





6.10 常返的和瞬时的随机游动 175 


上述排队过程的多维类似物更复杂.基弗 （ J . Kiefer ) 和华尔夫维茨 （ J . Wol - 
fowitz ) 奠定了它的理论基础 [On the theory of queues with many servers, Trans . 
Amer . Math . Soc , vol . 78(1955) pp . 1-18]. 

6.10 常返的和晡时的随机游动 

我们来对随机游动进行分类，这种分类与 6.8 节无关，而与 6.6 节的更新理论 
有密切的联系，给定直线上的一个分布函数 F , 我们在形式上 引入由 下式定义的区 
间 函数： 

U{I} = f2F k *{I}. ( 10 . 1 ) 

fc =0 

这个级数与 (6.2) 中的级数一样，但是当 F 不集中在半直线上时，即使 J 是有限区 
间，此级数也可能发散.我们将证明， （10.1) 的收敛或发散具有深刻的意义.基本的 
亊实是简单的，但由于必须特殊对待算术分布®,所以用公式表达比较困难. 

为了简略起见，令 A 表示区间 - h < x < h , 从+ «表示区间*-/1<3：<4 + /1. 
定理 1 ⑴ 如果尸是非算术的，那么或者对于每个有穷区间却有 [/{ J }< oo , 或 

者对于所有的区间都有 U { I } = oo . 

( ii ) 如果 F 是一个 步长为 A 的算术分布，那么或者对于每个有穷区间都有 
U {1) < oo , 或者对于包含形如 nA 的点的每个区间都有 U { I } = oo . 

( iii ) 如果 U { I n } < oo , 那么对于所有的 t 和 ft > 0, 

U { I h + t }^ U { I ih }. (10.2) 

为了易于引用这两种情形，我们引入定义（在定义中， F 得到了一个应厲于相 
应的随机游动的形容词). 

定义称 F 是瞬时的，如果对于所有的有穷区间有 1/{ J } < oo , 否則称 F 是常返 
的. 

除了它的概率意义外，此定理还和下列积分方程有关： 

Z = z + FirZ , (10.3) 

此方程与更新方程 （6.4) 类似，我们以这个积分方程为起点，来证明定理1 和 
定理 2 设 z 是连续的，并且对于 | z | < A ，0 < z ( i ) </ io , 在 /»* 外 z ( a :) = 0. 如果 
F 是瞬时的，那么 

Z [ x ) = J z ( x - y ) U { dy } (10.4) 

①称 F 是算术的，如果它的增点都在形如0, 土 A, ±2A,. •. 的点上.具有这种性质的最大的 A 称为 F 
的步长.（见 5.2 节 .） 
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是 (10.3) 的一个一致连续解，且 

0 < Z ( x ) < mo - U { I 2 h }. (10.5) 

Z 在4中的一点上达到最大值. 

这两个定理的证明 ( i ) 设对于某一 a >0, U { I a ] < oo , 选取 h < 令之在4 
外等于零，但不恒等于零.我们将用逐次逼近法来解 (10.3), 令= Z , 递推地令 

Z n ( x ) = z ( x ) + J Z n _ i(x - y ) F { dy }. (10.6) 

对于由下式定义的 t /„, 

U n ( I ) = F °*{ J } + • • • + (10.7) 

显然有 沈 

Z n { x ) = J z(x - y ) U n { dy }, (10.8) 

(积分 K 域实际上是一个长度 < 2 ft 的区间).这样定义的函数 Z „ 是连续的，我们 
用归纳法来证明，它在满足 Z (€n) > 0 的点^ 上达到最大值 M„. 对于 Zo = 
这显然是正 确的. 如果它对 Z n _! 是正确的，那么由 (10.6) 式可见， z(aO = 0蕴含 
之 n (®) < /^ n-li 而/> ^ n ({ n — l ) ^ ^ n — l ( Cn — l ) = Mn —1- 

由此推出，区间4+€„包 含在心 中，从而由 (10.8) 式有 

/ i „ < M ' U { l 2 h ), (10.9) 

这就证明了函数是一致有 界的. 因为2 0 < A 彡…，所以其中 Z 满 
足 (10.5) 

根据单调收敛性，由 (10.6) 式和 (10.8) 式推出，极限 Z 满足积分方程 (10.3), 
且具有 (10.4) 式的形式.由 （10.9) 式可知，不等式 (10.5) 成立. 上界仅依赖于 z 的最 
大值坤，我们可以对 A 的一个真子区间 A 内的所有点 A 能够 fl 由地令 z ( x ) = 

在这种情形下，我们由 （10.8) 式可得 

Zn ( x ) > (10.10) 

这个不等式对所有的 v < h 都成立，因而对于 T ) = h 也成立（因为 A 是闭的).把上 
述最后两个不等式联合起来就证明了 (10.2) 的正 确性. 这蕴含，对于长度< ft 的区 
间， U { I } < oo . 但是每个有穷区间都可以分成有限多个长度< A 的区间，因此对 
于所有有穷的 /,£/{/} < oo .最后由 (10.4) 式求差数可知， 


\Z(x + 5) - Z[x)\ < U {/ 2 /,} - sup \z(x + S)~ z(x)\. 
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因此，2是一致连续的，关于瞬时分布 F 的所有断言都得到了证明 • 

( ii ) 还有一种情形：对于每个 a > 0, U{I a } = oo. 那么 (10.10) 表明，对于一 
个包含原点的邻域内的所有的 x,Z n (x) — oo .如果 < 是 F 的增点，那么由 (10.6) 
式推出，对于一个包含 t 的邻域内的所有的 x,Z n (x) oo . 根据归纳法，这对 
于 F 2 *, F 3 *, • •-的每个增点也同样是正确的.假设 F 是一非算术 分布. 如果 F 
集中在一条射线上，那么我们有 U{I a ) < oo (6.6 节). 因此，根据 5.4 节的引理 
2, F 2 *, F 3 *, -- 的增点在直线上是稠密的，从而处处有 Z n (x) ^ oo . 这蘊含对于所 
有的区间， U n {I} ^ oo . 作明显的修改后，这个论证也适用于算术分布，因而定理 
得证. ► 

在第11章中，我们将回过头来讨论更新方程 (10.3), 但现在我们来讨论定理 
1 对随机游动的含义.设 x u x 2 ,." 是具有共同分布 F 的独立随机变量，并令 
S n = Xi + ■■■+X n , 所谓“随机游动在时刻 IZ = 1,2, ••逗 留在 J 上”，指的是 
5„ e / 这一事件. 

定理 3® 如果尸是瞬时的，那么随机游动在区间/上的逗留的次數是以概芈1 
为有限的，并且这种运留的平均次教等于 U { I }. 

如果 F 是常返的且是非算术的，那么随机游动在每个区« J 上运留的次敷以 
概丰1为 无穷. 如果 F 是常返的且是算术的，且步长为 A , 那么随机游动在每个点 
nX 上运留的次教以概牟1为 oo . 

证假设 F 是瞬 时的. 随机游动在时刻 n 后到达/的概率不大于 （10.1) 中的级数 
的第 n 个余部.因此，对于充分大的 n , 随机游动在 J 上的逗留次数大于 n 的概率 
<€这就证明了第1个断言. 

现在假设 F 是常返的且是非算术的.用 Ph(t) 表示随机游动到达 I h + t 的概聿. 
只要对所有的 h>0 和所有的 t 证明 p h = 1就够了，因为这显然蕖含随机游动在 
每个区间上的逗留次数必然为任意数. 

在着手证明之前，我们注意，如果 S „ = : c , 我们可以把: r 取为新原点，从而知 
道随机游动在此以后在4上逗留的概率等于 p h (- x ). 特别，如果 z 是4 + * 中的 
—个点，那么随机游动在此以后在 J 上逗留的概率< P2h(~t). 

我们首先证明 Ph (0) = 1. 对于任意固定的/» > 0,用 p r 表示随机游动在&上 
的逗留次数至少为 r 的 概率. 那么 p 1+ p x +…是随机游动在4上的逗留次数的 
期望，从而由常返性的定义知道它是无穷的.另一方面，由本节开始的陈述显然有 
Pr+l ^ Pr - P2h ( 0 ). 因此，由的发散性要求⑼ = 1- 

现在讨论一般的区间 I h + t. 首先假设 F 是非算术的.根据 5.4 节的引理2,对 

①本定理是 4.6 节中第2个 ( M 律的推论，如果+ 1) Sffl 机游动进入+ 1 无穷多次的氰率， 
那么对于一个固定的/,函数 v 只能取值0或 1. 另一方面，如果考患 随机游 动的第1步，可以肴 
出 V 5 = 因此沪 = const (见 11.9 节). 
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于某一 fc , 毎个区间包含的一个增点，因此对于所有的/» > 0和所有的随 
机游动进入4 + * 的概率 Pfc ( t ) 是 正的. 但是我们已经看到，即使在进入 J h + t 以 
后，随机游动还必然会回到根据本节开始的陈述，这蕴含 P2h(~t) = 1.因为 h 
和*是任意的，所以这就对算术分布完成了 证明. 但是同样的论证也适用于算术分 
布. ► 

在检验 £/{/} 的级数 （10.1) 是否收敛时，我们通常依靠极限定理，这些定理仅 
对于大区间提供信息.在这种情形下，可以依靠下 列的： 

准则 如果 f 是瞬时的， 則当; r - oo 时，有界的 ■ 

由 (10.2), 这个断言是显然的，因为任何区间可分布 n 个形如4 + * 的区 
间.作为方法的一种说明，我们来 证明： 

定理 4 一个分布的期望为 / i , 如果/* = 0,則此分布是常返的；如果 M #0, 則此 
分布是瞬时的. 

证设 A * = 0. 根据弱大数定律，存在一个整数 n e ,使得对于所有的 n > n e , P {|5„|< 
£«} > 因此，对于满足 n e < n < a/e 的 n , F "*{/ a } > ^. 如果 a > 2en c , 那么 
至少有 a /(2 c ) 个整数 n 满足这个条件，因此 U{h) > a /(4 c ). 因为 e 是任意的，所 
以这蘊含比 a~ l U{I a } 是无界的，因而 F 不可能是瞬时的. 

如果 /i > 0,那么强大数定律保证，“对于所有充分大的 n , S „ 为正”的概率任 
意地接近于 1. 因此，随机游动进入负半直线无穷多次的概率是零，于是 F 是瞬时 
的. ► 



图6> 2 由柯西分布产生的随机游动（为了消除图形的过份大的跳跃, 
我们对这个分布进行了截尾). 
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在常返过程中，序列 {«„} 必然无穷多次地改变符号， 因 此上升阶梯过程和下 
降阶梯过程是常返的.令人惊奇的是，其逆不真. 即使在瞬时随机游动中，{5„}也 
可以 (以概率 1) 无穷多次地改变 符号. 事实上，当 F 是对称分布时情况就是如此 •因 
为在有穷区间=57上逗留的次数是有限的，所以这蕴含（很粗略地说）符号的改 
变是由于跳跃度极大的偶然的跳跃《 | S „| 可能趄过任何界限，但无论 a 多么大，奇 
异的不等式 X n+1 <- S n - a 将无穷多次地发生. 

图 6*2 说明了大跳跃的发生，但它并没有完全表达了这种现象，因为为了得到 
有限的图形，所以必须对此分布进行截尾 • 


6.11 一般的马尔可夫链 

很容易把第1卷第15章中的离散马尔可夫链推广到欧几里得（以及更一般的） 
空间.在离散情形中，转移概率由含有元素 Po 的随机矩阵给出，这矩阵的行是概率 
分布.现在我们必须考虑从点 z 向 R " 中的任意区间或集合 r 的转移；用 K ( x , r ) 
表示这个转移的概率.新的特点是我们必须附加某些正则性条件，以保证必要的积 
分可以进行.对大多数用途，连续性这个条件就足够了，但是限制于完全的一般性 
将得不到什么东西. 

定义 1 随机核 k 是这样一个二元（即一个点与一个 集合） 函數，使得⑴对于固 
定的是 r 中一个概牟分布，并且 （ ii ) 对于任一区间 r , K ( x , r ) 是 a : 的 
贝尔函數. 

没有要求 A ： 定义在整个空间上.如果; c 和尸 限制于集合上，那么我们称 
A •集 中在上.有时需 要容许 有亏損 分布，这样我们就 有次随机核. 通常， A ： 具有 
形式 

K(x,r) = J r k(x,y)dy, ( 11 . 1 ) 

在这种情形下，称 fc 为一个 随机密度核. 按照 5.3 节 (3.3) 的约定，我们用简单符号 
K(x,dy) = k(x,y)dy 

来表示 (11.1). 【严格说来， A 表示关于勒贝格测度或长度的密度，关于任意测度 m 
的密度表示为 K ( x , dy ) = k ( x , y ) m { dy }.) 

在给出马尔可夫链的正式定义之前，我们可以从离散情形类推，来准备合适的 
分析工具.从 a : 经过两步转移到尸的概率可定义为 

JT ( 2 ) Ot , r ) = J n K ( x , dy ) K ( y , r ), (11.2) 
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积分区域是整个空间或是 A ： 所集中的集合 A 关系式 (11.2) 说明，第1 步从; r 转 
移到某点 J /, 第2步从 y 转移到 A 最重要的假定是，给定一个中间点 y , 过去的 
历史决不影响到将来的转移.类似的论证对于高阶转移概率也成立.如果令 
= K , 那么对任意的正整数，有 

K ^ m + n \ x , n = J n dy ) K ^\ y , r ); (11.3) 

当 m = n = 1 时,它化为 (11.2). 保持 in = 1, 并令 》= 1,2,3,…，我们就得到 
的归纳定义_为了一致起见，我们定义 if ( Q ) 为集中在 a ： 上的概率分布(所谓 
的科罗内克 ( Kronecker )<5 «). 于是 (11.3) 对于 m > 0， n 彡0都成立.两个核之间的 
运算 (11.3) 在其他领域中也经常出现，通常称之 为核的 合成.它在各个方面都类似 
于矩阵的乘法. 

几乎不必强调核是随 机的. 如果 K 有密度，那么也有密度，并且密 
度的合成 公式是 

* (m+n) (®, z ) = J n fc ( m ) ( x , y )* (n) (», z ) dy . (11.4) 

例 （ a ) 卷机如果 k ( x , y ) = f(y - x ), 其中 / 是一个概率密度，那么合成 (11.4) 
化为普通的卷积.如果 A ： 是齐次的，即 

K ( x , r ) = K(x + a,r + a ), 

其中 r + s 是把 r 平移 3 后所得到的集合，那么上述结论一般也是正确的，关于 
圆周上的卷积，见 8.7 节的定理 3. 

例 （ b ) 碰撞 时的能 i ■损失 _在物理学中，通常把质点的逐次碰撞作为随机过程来 
处理，使得如果在碰撞前 的能撤 （质童）等于 a : > 0,那么碰撞后的能量（质量）是这 
样一个随机变量 K 使得 P{y er } = 其中尺是一个随机核.标准的假 

定是，只可能发生损失，比值 y /: r 的分布 G 与; c 无关，于是 P{y < y } = G ( y / x ), 
此式定义了一个随机核. 

在一个有关的恒星辐射问题中 110.2 节例 （ b ) j 阿姆巴朱米扬 （ Ambarzumian ) 对 
于0 < W < 1考虑了 G { y ) = 的特殊情形，其中 A 是一个正常数_这对应于集中 
在0 < I / < z 上的密度核 \ y x -^ x - x , 容易验证，高阶密度为 

㈣ (x ， v) =1 ， 0 < y < *• ( 1L5 ) 

特殊值 A = 1对应于均匀分布（损失部分是“随机 分布" 的)，于是 (11.5) 化成 1.8 
节 (8.2). [将在 10.1 节例⑷中继续讨论 • 1 
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例 （ c ) 随机链.考虑 R 3 中的链(或折线)，链节有单位长度，并且相邻链节之间的 
角依赖于一个机会作用.它们的许多变形（常常是非常复杂的）出现在聚合物化学 
中，但是我们只考虑邻角是独立随机变量的情形. 

所谓端点为 A 和 S 的链 的长度 L , 指的是4和 B 之间的 距离， 把一个单位 
链节附加到一个长度为 a ; 的链上去，结果得到一个长度为 VP + 1 - 2* cos 0 的链, 
其中 e 是新链带与 A,B 联线之间的角.我们把0作为随机变量来处理，特别考虑 
两个在化学中具有特殊价值的分布. 

⑴设0等于60°和120°的概率均为 I 于是 co 80 = ± i , 被加长的链的长度 
服从随机核 K( X ,n, 此核賦予两点 vx^x+i 的概率都是1对于固定的 A 分 
布 if ( n , 集中在 2 n 个点上. 

( ii ) 设新链节的方向是“随机”选择的，即假设 cosO 在=1^中是均勻分布的. 
(见 1.10 节）被加长的链的长度 i 界于 * + 1和 - 1|之间.在这个范围内，根据 
余弦定理有 


P{L <y} = P{2xcos0 > a: 3 + 1 + y 2 } 

=I - [i 2 + 1 + y a ]/4*. 

因此，长度由下面的随机密度核 确定： 

H x > v) = y/21, I* - 1| < y < ® + 1. 

由 （n + 1) 个链节组成的链的长度 1„ +1 有一个密度 * (n )(l ， y). (见习题 23.) 

例 （ d ) 离散的马尔可夫链可以把随机矩阵 (p 0 ) 看成是一个定义在正整数集合 
上的关于一个测度 m 的随机密度 k(i,j) = Pij , 这个 m 对于每个整数賦予单位质 

世. 

绝对概率与平稳概串 

称序列 Xo,X u - 服从转移概率 K^ n \ 指的是 K^(x,r) 是事件 {X m+n G n 
在给定 x m = x 下的条件概率.如果不)的概率分布是 V 0, 那么的概年分布为 

v„(r)= / vo{da:}K( n )(x,r). (11.6) 

Jn 

定义2 称分布如 是关于 K 的平穗分布，如果对于所有的 n , v „=7 o , 即如果 

Vo{r} = / vo{dx}A-( n )(x,r). (11.7) 

Jn 

关于平稳分布的基本事实与在离散马尔可夫链的情形中一样_ 对 K 附加较弱 
的正則性条件后，存在唯一的一个平穗分布，它表示在任一初始分布下的渐近 
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分布. 换句话说，初始状态的影响逐渐消失，系统趋于由平稳解支配 的穗定 状态. 
这是遍历定理的一种形式 • 

例 （ e ) (9.1) 中定义的排 队过狂 { W „} 是一个集中在闭区间0^上的马尔可夫过 
程. 转移概率只对 x , y ^0 才有定义，而且 K ( x , 0^) = F ( y - x ). 我们将在 8.7 节 
中证明平稳测度的存在性. 

例 （ f ) 设 x u x 2 , - 是相互独立的正变量，它们的共同分布 F 集中在0^3上 ， F 
有一个连续密度 /. 下面用递推方式定义一个随机变量序列 { Y k }, 


Yi = X u Y n+1 = \ Y n - X n+1 \. 

那么 { n } 是一个集中在 w 上的马尔可夫链，具有转移概率密度 

Jb(x,y)= + /(* + «)• 0<y<x, 

f(x + y) i/ > x > 0. 

平稳密度 S 的定义方程是 

ff(v) = g{x + y)f(x)dx + j s ⑻ /(® + y)dx. 
如果 F 有有限的期望 /*, 那么 


( 11 . 8 ) 


(11.9) 


( 11 . 10 ) 


ff(y) = M _ 1 U-^(y)] (ii.il) 

是一个平 稳概芈 密度.事实上，利用简单的分步积分可以证明 s 满足① (11.10) .我 
们由 5.6 节 (6.3) 知道， S 是一个概率密度.（见习题 22.) 

例 （ g ) 技术上的应用 .® 长途电话线是由一条条的电缆组成的，电缆的特征服从 
统计起伏.我们把与理想值的偏差作为独立随机变，…来处理，并假设它 
们的作用是可加的.倒转一条电缆，则改变由它引起的偏差值的符号.假定偏差 y fc 
是对称的，令长途电话线的有效建造可以按照下列归纳法则进 行：把 
第 （n + 1) 条电缆联接在这样的位置上，使得由它引起的误差的符号与前 n 条电 
缆的累积误差的符号相反.那么累积误差满足法则 (11.8)； 平稳密度 (11.11) 实际 
上是 一个极限分布 • 由 n 条电纜 纽成的电话綫的误差（对于很大的 n ) 的近似密度 
为 (11.11). 另一方面，如果各条电缆是随机地联接在一起的，那么可以应用中心极 

①人们怎样发理了这一点？假设9和/有导数，我们芎以对 （11.10) 进行形式 徽分. 利用分»«分 
可得关系式 ^( v ) = _ S ⑼/( V ).此式说明9应当具有形式 (11.11). 然后不加可微性条件，直接 
舱证 (11.11) 的正礁性 ■ 

® 是根据 H . von Schelling , Elektrische Nadir .- Technik , vol . 20(1943) pp . 251-259 中所用的离 

ft 模型改编的. 



限定理，误差的方差随 n (即电缆的长度）线性增加.因此，利用检验误差符号的简 
单办法可以使它保持有界. ► 

在上例中，马尔可夫序列 X 0 , Ai ,_ ••是用初始 分布如 和转移概率 A ： 定义的. 
( X 0 , X lr --, X n ) 的联合分布具有形式 

wo { da ； o }^( a ： o , dii )- ■ ■ K ( x n - i , dx n ), 

这已经在 3.8 节和第1卷 15.1 节中讨论 过了. 这里我们得到了一个可以说明用 
条件概率定义绝对概率的优点的典型例子.更系统的方法是以下列假设为定义开 
始的 ■ 

P {-^ n+l € r|Ao = a ：。,... ， X n = In } = K ( x n , r ). (11.12) 

这里， 马尔可 夫性由下列事实来表示《上式右边与吻，々无关，因此“过 
去的历史”没有 作用. 这个定义的缺点是我们必须解决条件概率的存在性、唯一性 
等问题. 

(关于依赖于连续时间参数的马尔可夫过程，见第10章 .） 

*6.12 鞅 

首先我们可以考虑这样的随机过程 { X n }, 使得 ( X ir --, X n ) 的联合分布有一 
个严格正的连续密度 p „. 那么可用 3.2 节中的初等方法定义条件密度和期望.假设 
变量和的期望存在. 

称序列 { X „} 是绝对公平的，如果对于 n = 1,2，."， 

E ( Xi ) = 0, E ( X n +1 | X 1 ,---, X „)=0. (12.1) 

称序列 { Y n } 是一个韃，如果 

， …, y n ) = y„,n= (12.2) 

(下面将给出一个更灵活的定义 •） 

两个类型之间的关系非常简单.给定一个绝对公平的序列 { X „}, 令 

= -^1 + • • • + x n + C, (12.3) 

其中 c 是一个常数，那么 

E ( Y n +1 \ X u ---, X n ) = Y n . (12.4) 

* 我们之所以讨论鞅，是由于它弈常 重®, 但是在本书中我们没有把它作为一个工具使用. 
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诸条件变量可以换为 K ， 因而 (12.4) 等价于 (12.2). 另一方面，给定一个鞅 
{ Y n }, 令 A = y , - EiYt ^ Xn+i = Y n+1 - Y n , 那么 { X „} 是一个绝对公平的序 
列，（ I 2 . 3 )对于 csE ^) 成立. 因此， { r „} 是一 个鞅， 当且仅当它具有形式 （ I 2 . 3 ), 
其中 { X n } 是绝对公平的. 

鞅的概念应归功于 P . 列维.但是，认识到它的出乎意外的潜力并发展了这个 
理论的却是杜布.在 7.9 节中我们将证明，在较弱的有界性条件下，狭变量 h 收敛 
于一个极限，这个事实对于现代随机过程理论是很重要的. 

例 （ a ) 古典的赌博与满足 E ( X n y =0 的独立变董 有关. 这样的赌博是绝对公 
平的 ®, 部分和 S „= J ^+ ••• + & 构成一个鞅.现在考虑普通的掷硬币的赌博，其 
中赌徒按照某种依赖于以前的投掷结果的规则选定赌金.逐次的贏金不再是独立 
的随机变鲎了，但赌博仍然是绝对公 平的. 公平赌博的思想是，过去的知识不能使 
赌徒改善他的 运气. 在直观上，这表示绝对公平的赌博在任一种醏博方式下，即在 
允许不参加个别投掷的规则下，仍然是绝对公平的.我们将看到事实确是如此. 

例 （ b ) [第1卷 5.2 节 （ c ) 的1波利亚罐子 模型. 一个罐子包含 b 个黑球和 r 个红 
球. 随机地取出一个球.把它放回，并加入 c 个与取出的那个球有相同颜色的球.令 
Y a = ^；, V „ 是第 n 次取球后得到的黑球的比率，那么 { V „} 是一个轶.在这种 
情形下，收敛性定理保证了极限分布的存在[见 7.4 节例⑷和 7.9 节例 ⑷]. 

例 （ c ) 和诘异數®•设 {X n } 是一个马尔可夫链，其转移概率由 随机核给出. 
关于的期望我们什么也没有假设.称函数 u 关于 K 是和谐的，如果 

«( x ) = J K(x,dy)u{y). (12.5) 


用 u = u ( x k ) 定义随机变董 y *, 假设所有的期望都存在（例如，《是有界的).关 
系式 （12.5) 和 E(y* + i|X fc =*) = «(*) 相同，因此 E ( n + l | X fc ) = n . 因为 { Xfc } 是 
马尔可夫链，所以这蘊含 (12.4)； 因为 h 是 X * 的函数，所以这又蘊含（12.2)(见 
5.11 节例 （ a )). 因此， { Y n } 是一个鞅.这个结果在马尔可夫链的边界理论中具有重 
大意义，因为的极限的存在性通常《[含给定序列 { x n } 的极限的存在性.[见例 
( f ) 和 7.9 节例 （ c).I 

例 （ d ) 似然比. 假设已知在随机过程 x u x 3 r - ( Xu ---, X n ) 的联合密度或 

是 P „ 或是如，但我们不知道是哪一个.为了作出判定，统计学家引入一个新变量 


Y — gnd ， … ， X n ) 

n ~Pn(X U ---,X n ) 


( 12 . 6 ) 


①这个*念的实际局隁性巳在第丨卷 10.3 节中讨论 过了. 应当回忆一下，有这样一种“ 公平" 的赌 
博，使第 n 次投掷后，磨徒的贏金以*率> 1 — * 与 n/lnn 一样大. 

® 这个术》是亨持 （ G . Hunt ) 引 入的. 



*6.12 鞅 185 


在充分正则的条件下，似乎应该有：如果真实密度是 p n , 那么 X u …, X n 的观察 
值一般说来应聚集在使 Pn 较大的 点上. 如果事实确是如此，那么根据真实密度是 
P „ 或如，可能很小或 很大. 因此， { Y n } 的渐近性质在统计决策理论中是很有意 
义的. 

为了简单起见，我们假设密度 p n 是一个严格正的连续函数.如果/>„是真实 
密度，那么 X n +1 在给定 X ly -, X n 下的条件密度等于比 p „ +1 / p „, 因此 

E(y n+ lpfi =X1, …， X n = Xn) 

_ f + °° Qn + i ( xi ,---, x n , y ) p w + i ( zi .---, a ； n , y ) J .. n97 、 

~ J-oo p n +l(xu---,x n ,y) Pn(xi, 

因子 Pn + i 相互抵消.第 2 个分母与 y 无关， 9„+ i 的积分由边缘密度 g „+ i 给出•因 
此， (12.7) 化成 q„/p n , 从而 (12.4) 是正确的.因此，在现在的条件下，似然比构 
成一 个鞅. ► 

在 (12.2) 中所用的条件并不太好，因为我们常常必须把条件变量 !!,•••, 换 
成它们的某些函数.[在 (12.4) 中就是这样 .] 例 （ a ) 揭示了较大的缺点.基本过程 
(例如，掷硬币或轮盘赌博）是用一列随机变 M &表示的，赌徒在第 ( n +1) 次试 
验的贏金是 A ，…， Z „ +1 和其他变世的某一函数.可观察的过去用 （ A ，…， Z „) 表 
示，（^，…，^提供的信息也许比过去的贏金提供的信息还要多.例如，如果赌徒 
不参加号码为1, 3, 5, ••• 的投掷，那么他直到时刻 2 n 的贏金所提供的信息充其 
董等于 Z 2 , Z 4 , -,2 2 n 所提供的 信息.这里軋 為,…所提供的附加信息从原则上 
讲是一个优点，在这种情形下的绝对公平性建立在以 Z lr -., Z n 为条件的基础上. 
因此，以几个（由随机变董组成的）集合为条件也许是必要的，为了顾及到所有的 
情况，最好是利用任意的事件 a 代数作为条件. 

考虑任一个概率空间中的随机变撤序列 {¥„}, 并用&表示 （ U ，•■•,&) 产生 
的亊件 er 代数（见 5.10 节)，那么定义关系式 （12.2) 和 E { K n +1 m „} = y „ 相同.我 
们想把此式作为定义关系式，但把 <7代数换为较大的 cr 代数®在大多数情 
形下， ®„ 是由 Fi , …, K 和其他的依赖于过去的随机变董产生的.想法是，任一依 
赖于过去的随机变量应当是关于®„可 测的. 在这个意义下，表示过程的过去 
历史中所包含的信息.由于这信息随时间的变化变得越来越丰富，所以我们将假设 
是增加的，即 

®1 C »2 c •••. (12.8) 

定义1 设 X 1 , X 2 , …是随机变它们的期望都存在.设…是满足 （12.8) 
的事件 <7 代數. 

当且仅当 


E ( y n+1 |®„) = Y n 


(12.9) 
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时，序列 { K } 关于 {* n } 是一个鞅. 

[由于条件期望的不唯一性， （12.9) 应读作“存在一个使 (12.9) 成立的条件期望 
的代表”.这个说明在以后也适用 .] 

注意， (12.9) 堇含 K 是 ® n 可测的，这有两个重要的 推论. 因为3 ®„- i , 
所以 5.7 节 (11.7) 关于累次期望的基本恒等式说明 

E ( F n+1 |® n _ 1 ) = y n _ 1 . 

由归纳法可以看出，定义式 (12.9) &含 更强的 关系式 

£(^+ 1|»0 = ^, * = 1 , ( 12 . 10 ) 

由此特别推出， 鞅的每个子序列 1^,& •也是鞅. 其次，我们 注意. ® n 包含 
由变董…，产生的 a 代数，同样的论证表明， { Y n } 关于 { Un } 也是狭•因 
此，（12.9)殖含 (12.2). 

例 （ e ) 设 a 代数 B „ 满足 (12.8), 并设 y 是一个任意的随机变量，它的期望存 
在•令 V n = E ( y |® n ), 那么 K 是 B „ 可测的，因此 (12.9) 成立.所以 { Y n } 是一 
个勒. ► 

我们回过头来讨论例 （》), 现在容易证明一个相当一般的系统的不可能性.设 
{ Y n } 关于 {»„} 构成一个狭.为了说明赌徒可以不参加第71次投掷，我们引入一 
个决策*數这是一个只取0和1的»„_!可测的 ® 随机变贵.结果当 e „ == 0时， 
赌徒不参加第 n 次 投掷； 当= 1时，他参加第 n 次投掷.在这种情形下，他在第 
n 次投掷的贏金是 K •用表示他直到第 r » 次（包括第 n 次）投掷的累积 

贏金，我们有 

■Zn = Z n -i + £n[ln — in-l]- (12.11) 

由归纳法可见，的期望存在.此外， Z n . lt e n ^ 匕一是»„_!可测的，因此[见 
5.11 节 (11.6)] 


E ^ IBn-O = Z n _! + - y n _,]. (12.12) 

因为 { Y n } 是一个鞅，所以括号内的式子等于零，从而 { Z n } 是一个鞅.因此，我们 
证明了一个应归功于哈尔莫斯 （ P . R . Halmos ) 的定理，这个定理表明， 

系统的不可能性 每个决策函数序列句， £2 ，…把鞅 { Y n } 变成一个鞅 { Z n ). 

最重要的特殊情形是可选伴止.这指的是一个接受前 iV 次试验而跳过以后的 
所有试验的系统；第 iV 次试验是最后一次 试验. 这里 iV (停止的时刻)是这样一个随 

①这个条件保证了决策是根据过去的观察历史作 出的. 任何一种数学理论*不能反《对未来的 預见， 
我们应把它从我们的模中搏除出去. 
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机变董，使得事件{况> A ：} 在® 中.（利用定理中的记号，当 JV > *-1 时，印=1; 
当 彡 fc - 1 时， e fc = 0.) 因此我们有 
系 可选伴止不影响鞅性质 • 

例 （ f ) 直线上的简单随机游动从原点开始，质点以概率 p 向右移动一步，以 
概率 g = 1 - p 向左移动一步.如果 S „ 是质点在时刻 n 的位置，那么容易看 
m, Y n = ( g | p )* n 构成一个鞅，其中 E ( r n ) = l , E ( y 0 ) = l . [这是例 （ c ) 的一个特殊 
情形 .1 

在破产问题中，随机游动在它首次到达两个位置 - a 和6之一时停止，其中 a 
和6都是正整数.在这种修改了的过程中， -a(S n 《 b,S n 以概率1最终停在6或 
- a 上.用: c 和1 表示相应的概率. 因为 S„ 是有界的，所以 

( 2) 1 + ( , 

但是，因为鞅的期望是常数，所以 E (5„) = 1. 因此，右边等于1,并且这个线性方 
程确定了 x . 于是我们求出了停在&上的概率，在第1卷 14.2 节中曾用不同方法导 
出过这个概率.当 P = < j 时公式就不成立了，但在这种情形下， { S „} 是一个鞅，同 
样的论证可证明 : r = a/(a + 6). 虽然这个结果是初等的且是众所周知的，但是这个 
论#说明了鞅论的可能的用途. 

例 （ g ) 关于 系统. 考虑独立随机变量的序列，其中取值 ±2" 的概率均为 
赌徒通过掷一硬币来决定他是否参加第 n 次 打赌. 他第一次参加打赌发生在时 
刻 n 的概率是2_”.在这种情形下， 他的 贏金是 ±2". 因此， 醏徒在他的第一次打 
賭中的赢金是一个期望不存在的随机变量. 因此，系统定理依赖于我们没有改变时 
间参数这个事实. ► 

我们常常必须和绝对值及不等式打交道，因此为方便起见，我们给满足（12.9)(把 
等式换为不等式）的过程起一个名宇. 

定义2 称序列 { V n } 是一个下鞅如果 

E ( y „ +1 | B „) ^ y n . 

由此又立即推出，每个下鞅都满足更强的条件 t 

E ( y „+ i |®*)> y fc , k = i ,•••,». ( i 2. i 3) 

弓 I 理 如果 u 是一个凸函數， { K n } 是一个韃，且 u ( y n ) 的期望存在，那么 («( y „)} 
也是一个下鞅.特别地， {| v „|} 是一个 下鞅. 

①比较*老的术巳经度弃不用了. 
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根据詹生不等式 [5.8 节 (8.6)], 引理的证明是显然的.这个不等式既适用于普通 
的期望，也适用于条件期望.它说明 

E(u(y n+1 )|* n ) ^ u(£(y n+1 |* n )), (12.14) 


右边等于 u(r n ). 

同样的论证表明，如果 {¥„} 是一个下鞅， u 是一个非減的凸函数，且 u(y„) 的 
望期存在，那么 { u ( Vn )} 也是一个下鞅. 

6.13 习 题 

1. 稳定分布的定义 (1.2) 等 价于： ft 是稳定的，当且仅当对于任意常败 C1.C2, 存在常败 
C 和 J/, 使得 

ciXi + caXa = cX + v. 

2. 每个稳定分布都是连埃的.只要对于对称的证明它就够了.由 (1.3) 证明，如果 fl 在 
点 S > 0上有一个质量为 p 的原子，那么它在形如 5(c m +c n )/c ra+n 的每个点上有质 
a>p 2 的原子（见 5.4 节).此外，如果 i? 有唯一的-个原子，它位于原点且质童< 1, 
那么 R-kR 在原点有一个 质釐为 p 2 的原子，然而稳定性要求 R-kR 有质世为；)的原 
子. 

3. 为使 F 是稳定的，只需姿 (1.2) 对 t* = 2 和 3 成立就够了 （P. 列维). 

提示： 形如 cic§( 其中 j,fc = 0, 土 1,±2,..)的乘积或者在0^5中是稠密的，或者是 -- 
固定数 c 的幕 应当证明，在目前的情况下，后者是不可能的. 

注奇怪的是，只要求 (1.2) 对 n = 2成立是不够的•见 17.3 节例 （f) 和 9.10 节的习 
题 10. 

4. 对于指数为1的稳定分布，定义关系式 (1.2) 中的中心参数满足= m«„ + 
n« m [JSL (1.6)]. (1.8) 的类似公式是 


a(Xi + v Ins) + t(Xa + u lni)=(a + t)(X + v ln(« + 1)). 


5 . 如果 F 和 G 是稳定的，且具有相同的指数那么 F - kG 也是稳定的，其指数也是 
a. 试根据 F 和 G 的中心常败求 F - kG 的中心常数 《„• 

6. 对于对称稳定分布 5.5 节 (5.11) 对称化不等式蕴含 n[l - ^(0„*)] 是有界的.证 
明 ■ H 有阶教小于 0 的绝对矩 | 利用 5.6 节 (6.3)]. 根据对称化，最后这个陈述可 搬到非 
对称的 flJl. 

7. 霍尔特斯马克分布的另一种推导.考虑一个中心在原点半径为7•的球，把 n 个星（点） 
独立且随机地放到它里面.设每个星有单位 质量. 设是各个星产生的 
引力的 * 分量， Sn = Xi + … + X n . 令 r — » oo,r» —* oo , 使得 |r 3 jin _1 —♦ 证明 i 

的分布趋于特征指败为 I 的对称稳定分布. 
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8. 如果星的质量是期望为1的随机变量，若假设星的质量是相互独立的，并且也和星的 
位置独立，那么上理在本质上没有改变. 

9. 四维的霍尔特斯马克分布. S 尔特斯马克分布的四维类似分布是一个特征指数为 | 的 
对称稳定分布.（在四维中，引力和距离的立方成反比 •） 

10. 通过增加只取零值的哑变量并把某些行适当地重复几次，可以把在第 n 行上有个 
分童的三角形阵列变换成一个实质上与它等价的在第 n 行上有 n 个分量的三 
角形阵列. 

11. 设 是- 个零三角形阵列，其中 Xi, n ,- -,X„, n 有共同的分布&•问 P{max 
(| Xi lB |,.-,| X „,„|)> £ } 趋于零吗？ 

12. 如果 F 有一个密度⑷ /(*) = f ,( b )/(*) = xcT ' 求 (6.3) 的更新函败（/的 
密度. 

13. 在一个可终止过程中， F 有一个密度 pee — 04 . 求寿命的分布和更新时刻的个败的分布. 

14. 广义的可终止更新过《.不假设过程以概率 9 立即终止.而假设它以概率 g 持续一段具 
有正常分布凡的随机时间，然后停止.换句话说，更新时刻具有 形式： n +^+ rn + y , 
其中最后一个变置有不同的分布.证明^过程的持续时间的分布 v 满足更新方程 


V = qFo + F-kV ( F ( oo ) = l - ff ). 


(*) 


15. 证明，关于大间隔的等待时间问埋可化成上理所述的过程的一个特殊情形.把 （7.4) 写 
成 （*) 的形式. 

16. 泊松过 程与覆 ▲定攻.我们由 3.3 节例 （ d ) 知道，如果在一个泊松过程中，有 r » 个更 
新时刻出现在 P 中，那么它们的（条件）分布是均匀的.因此，不出现长度为 f 的间 
隔的概率1 - V ( t ) 可由 1.9 节中的覆盖定理3推出： 

終^淋 （•) 

( a ) 验证 I 当 F ( x ) = 1 - e -« H , 上式确实是 (7.1) 的解. 

( b ) 假设 （*) 是 (7.1) 的唯一解，由它推导《盖 定理. （这是一个利用随机化证明的实 
例.见第1卷 12.6 节的习® 5.) 

17•在 6.7 节例 （ f ) 中等待第1个失去的呼叫所需要的等待时间.应解释为一个可终止过 
程的总寿命，这个过程是通过当呼叫在忙期中第1次出现时停止原来的过程所得到 
的®.试证：此可终止过程的忙期的持续时间的分布 / f 是 H { dt } = e ~ at F { dt }, 而且 
循环时间的分布为 G - kH . (又见 14.10 节的习題3和习题 4.) 

①这个簡单的方法代替了文献中提出的复杂的方法，并得到了更简单的明 ft 结果.关于解和估什，见 
11.6 节. 
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18•设 V 是 6.7 节例 （ g ) (先为后到者趿务）中忙期的分布.证明 • V 满足更新方程 V ( t ) = 
A ⑷ + B - kV ( t ), 其中 >1 和 B 是由 A { dx } = e - M G { d *} 和 B { dx } = [1 - G ^ Jce - 31 
确定的亏损分布.（证明我们讨论的是一个在习题14的意义下的广义可终止过程> 紧 
接在由 B 产生的更新过程的后面有一个不受干扰的静止周期，这个静止周期的分布 
与 A 成正比 .） 

19. 泊松过程中的小间隔.①称“重合"发生在时刻如果更新时刻 S „- t 和 S n 的距离 

求等待第1次重合的等待时间的分布的更新方程，并由这个更新方程推断这个 
分布是正常的. 

2 0. ® 推广. 在标准更新过程 s „ = Ti + ---+ T n 求事件 { r „ 笫1次发生所需要 

的等待时间的分布的更新方程，其中 n 与过程独立，并且 V * 相互独立，且有共同的 
分布 G . 

21. 设奶，…， a „ 是一有穷数列，其部分和为 

a* = oi H - ha*. 

递推地定义 

t>i = ai | J 0 ,«a = ( t>i + o „_ i ) U 0, •••,«„ = (« n_i + Oi ) U 0. 

用归纳法证明 I = max [0,8, I ---,5„]. 证明，这龜含 6.9 节的定理. 

22. 在 6.11 节例 （ f ) 中假设对于0<*<1, /(*) = 1•证明 I fl ( V ) = 2(1 - V )是一个平稳 
密度，并且对于 n 彡 2, fc ( n ) ( i , y ) = ^( y )- 如果 /(*) = ae ~ az , 那么 fl ( a :) = /(*). 

23. 用下式定义一个集中在 07 T 上的随机密度核 ■ 

f 1(1-») -1 ， 0 < i < v < 1, 

*(*,»)={ \ 

I 2 * 1 ' o < » < * < 1 , 

求平稳 密度. （它满足一个简单的微分方程 .） 给出其概率解释. 

24. 一个在上的马尔可夫链是这样的，使得如果= Z, 那么 X „ +1 在 T ^ iTi 上是 
均匀分 布的.证明： 平稳密度是 2*. (鱼返正 （ T . Ugaheri ).) 

25. —个在 O ^ S 上的马尔可夫链的定义如下，如果= a :, 那么在0^5上是均匀 
分布的（这里《 = 0,1,".).试用归纳法证明，第《步转移有密度核 

fc <n) (*,»)=( 2- x ( n - l )! (^ ir ) ’ 0< « <2 "*， 

I 0， 其他 • 


® 关于用不间方法处理的变形，见 E. N. Gilbert and H. O. Poliak, Goincidencea in Poisson 
Patterns , Bell System Technical J., vol. 36(1957) ppl005-1033. 

® $ 间 W" 问理有一个类似的推广，且这种推广有一个类似的答案. 



第 7 章大数定律，在分析中的应用 

本聿的第1部分说明，一些著名的深刻的分析定理可以非常容易地用概率论 
的方法推导出来 . 7.7 节和 7.8 节讨论各种大数定律 . 7.9 节包含鞅收敛定理的一种 
特殊形式，与其余部分无关. 


7.1 主要引理与记号 

作为准备，我们考虑一个期望为0、方差为 ( T 2 的一维分布 G . 如果:^，…， 

是具有共同分布 G 的独立变童，那么它们的算术平均值 M n = (X 1 + --- + X n )n~ l 
的期望为0,方差为 ^ n - 1 . 对于很大的 n , 这个方差是很小的， M „ 可能很接近于 
0- 由此推出，对于每个连续函数 u , u ( M „) 很接近于 《(<>)• 这个陈述就是弱大数定 
律.下列引理对它作了较小的推广，尽管此引理很简单，但却很有用. 

对于 n = 1,2,…，考虑期望为0、方差为 al(0) 的分布族 F n , e ； 这里0是一个 
在有限或无限区间中变化的参数.对于期望，我们利用记号 

E „, s ( u ) = J u ( ar ) F „,®{ dx }. (1.1) 

引理飯设 u 是有界且连埃的，并且对于每个0, <^0)-0. 那么 

E „,9( u ) -> u(0). (1.2) 

在使得 al {9) 一致地超于0的每个闭区间中，上面的收敛是一致的 • 

证显然 

| En,®(«)-«WK J | u ( x ) - u ( fl )| F „,«{ da :}. (1.3) 

存在一个依赖于0和 e 的 <5,使得当- < 5时，被积函数< e . 在这个邻域外， 
被积函数小于某个常数 M , 根据 5.7 节 (7.2) 切比雪夫不等式，区域> d 所 
具有的概率小于 al(0)6~\ 于是，只要取 n 为这样大，使得 al(0) < e^/M , 那么 
(1.3) 的右边就小于 2 e . 如果一致地有 oi{0) 0,并且 u 是一致连续的，那么这个 

对 n 的约束与0无关. ► 
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例 ⑷如果是一个集中在点 k/n(k = 0, • • •,«) 上的二项分布，那么 ct^0) = 
0(1- On - 1 — 0,从而在0 < 0 < 1上一致地有 

E «(^) O fc (l - W k ―邮). （1.4) 

我们将在 7.2 节中讨论它的含义. 

例 （ b ) 如果& 0 是一个对点 fc / r » 賦予概率 e -^( nd )*/*! 的泊松分布，那么我们 
有 = e / n , 从而在每个有限的 0 区间中一致地有 

这个公式对非整败 n 也成立.（在 7.5 节和 7.6 节中继续讨论 •） 

例 （ c ) 把取作一个期望为0,方差为 0/ n 的 r 分布.我们得到，在每个有限 
区间中一致地有 


只要把 （n - 1)! 换成 r ( n ), 这个公式对非整数 n 也成立.在 7.6 节中将证明， (1.6) 
是拉普拉斯变换的反演公式. 

例 （ d ) 统计学家常常遇到本节开始时所述的情况，但他们把0看作是一个需要 
根据观察估计的未知 参数. 那么，用统计学的语言来说，关系式 （1.2) 说明， u(M n ) 
是未知参数 u (0) 的漸近无偏估计量.[如果 （1.2) 的两边相等，那么此估计董是无偏 
的.】 ► 

我们将会看到，上面的每一个例子都将导致具有不同意义的结果，但是为了进 
一步发展理论，必须先做一些准备 X 作. 

楚分记号 

在以下几节中，我们将使用有限差分计箅的方便的记号.给定一个有穷或无穷 
数列 ao . a !,- -, 我们把差分算子厶定义为 A ai = 叫 +1 - a< . 它产生一个新数列 
{ Aoi }, 再一次应用算子厶，我们得到一个元索为 

A 2 o< =厶0<+1 — Aoi = di+2 — 2ai+i + Oj 

的 数列. 以同样的方式继续进行下去，我们可以归纳地用= AA - 1 来定义》•次 
幂容易验证 r 

△ 、 = 部 )(-irw (1-7) 
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为了一致起见，我们把 M 定义为恒等算子，即 A°a i = a i . 那么 (1.7) 对所有 
的 r > 0都 成立. 当然，如果 oo, …, a„ 是一个有穷数列，那么 r 的可变性是有限 
的. 

一旦注意到对任意一对数列{叫}和 {cj 有一个奇特的互反性关系，就可以避 
免许多冗长的计算；利用这个关系，我们能用来表示差分 A r o if 反之亦然.为 
了推导这个关系，用0^&乘（10.7),并对 r = 0, …，I；求和.可以求出的系 
数等于 



-(-1” (旭 (V>-1 广〜. 

(这里引进了新的求和指标 = ) 最后的和等于 △'■-七， 于是我们得到了 

一 般的互 反公式 

Q(-ir)f Ci . (1.8) 

例 （e) (反演公式 .） 考虑一个对所有的 i 都有叫=1的常数序列.于是， A 0 Oi = 1, 
但所有其他的差分等于零，因而 (1.8) 化成 

c o = EQ(- 1 ) V ' JAW ' ic i- (1-9) 

如果把数列{勺}换成 {c fc+i }, 我们看出，把 CQ 和分别换为 Cfc 和 c fc+j 后 （1.9) 
仍然成立，从而 (1.9) 是以其差分表示给定数列的反演公式.这里 v 可以任意选择. 
例 （f ) 设0<0<1是固定的.并定义〜=0'那么 

A*Cr = 俨 (1 - 0) k )(-l) k , 

从而 (1.8) 化为 

》(:)△、= X) 妒 (i -吖乂 _ ► 

我们常常研究项为 a fc = u(x + kh) 的数列，这些项是通过固定一点 Z 和一个 
步长/I > 0而得到的.于是，由于明显的理由把差分算子 △ 换为差商+ = 将 

是很方便的.因此， 

A w(i) = [«(a: + h)~ u(x)]/h, (1.11) 
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更一般地， r 

A r «(*) = h _ r 13 Q i - iy -^ ix + jh ). 

特别地， A°u(x) = u(x). 

7.2 伯因斯坦多项式，绝对单调函数 

我们回到关系式 (1.4), 它的左边是一个多项式，我们称之为相应于给定的函 
数 u 的 n 次伯因斯坦多 项式. 为了强调这种依赖性，我们用丑 „, u 来表示它.于是 

Bn , u ( 0 ) = 炉 (1 - 0 ) n - j . (2.1) 

其中为方便起见，我们令 n - 1 = h . 与 （1.10) 比较，我们看出， B „, u 可以写成另一 
种形式 

Bn , u { 0 ) = E (") ( W )" ⑼， h = i - (2.2) 

由伯因斯坦多项式的表达式 （2.1) 和 (2.2) 是等价的这个事实，可以做出许多 
深刻的 结论. 在作这方面的叙述之前，我们重新叙述一下 7.1 节例 （ a ) 中导出的结 
果. 

定理1 如果 u 在闭区间 V 中是连埃的，那么伯因斯坦多項式 B „,„ —致地赵 
于 u ( 0 ). 

换句话说，对于给定的 e > 0和所有充分大的 U , 

\ B n , u ( 9 ) - «(0)| < e , 0 < 沒彡 1， (2.3) 

著名的魏尔斯特拉斯 ( Weiestraas ) 遢近定理保证了用某些多项式一致逼近的可能 
性•本定理更深刻，因为它指出了逼近多 项式. 上面的证明应归功于 S •伯因斯坦. 

作为伯因斯坦多项式的两种表达式的第一个应用，我们来推导下列可以用具 
有正系数的幂级数来表示的函数的一种特征， 

«(*) = P 0 +PIX + P 2 X 2 + ■■•, Pj ^0, 0 < ® < 1. (2.4) 

显然，这样的函数的各阶导数都存在，并且 

u ( n ) ( x ) ^ 0, 0 < I < 1. (2.5) 

在分析中的许多场合，重要的是其逆也成立，即任一满足性质 (2.5) 的函数都有一 
个幂级数表达式 (2.4), 伯因斯坦首先注意到了这个问题，但通常的证明既不简单 
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又不直观.我们将说明，伯因斯坦多项式的表达式 （2.2) 可导致一个简单的证明和 
一个有用的结果，这个结果是，性质 （2.4) 和 （2.5) 等价另外一个性质，即 

△ fc u c ⑼彡0, A = 0, • • • , n — 1, h =二. (2.6) 

这些结果对概率论很有意义，因为如果 { Pr } 是正整数上的一个概率分布，那 
么 (2.4) 确定了它的母函数(见第1卷第11章)，因而我们正在讨论的是刻概芈母 
函數的特征的 问题.在我们的函数中，可以用明显的正规化条件 ti ( l ) = l 来辨别它 
们.但是，例子 tiOr ) = ( I -*)- 1 说明，具有级数表达式 (2.4) 的函数不一定是有界 
的. 

定理 2 对于定义在0 < * < 1上的连续函數 u , 3个性质（ 2 .4)、 （2.5) 和 （2.6) 是 
完全等价的. 

称具有这种性质的*數为01中的绝对 单调* 數. 

证我们分两步进行，首先只考虑概率母函数.换句话说，我们现在假设 tx 在闭区 
间 V 中是连续的，而且 ti ( l ) = 1. 

显然， (2.4) 蕴含 (2.5). 如果 (2.5) 成立，那么 u 以及它的各阶导数都是单调 
的 . u 的单调性疽含 Au(x) > 0,而 u ' 的单调性蘊含 A «( x ) 单调地依赖于 a :, 因此 
A 2 u ( x ) > 0. 由归纳法知， (2.5) 蕴含 (2.6), 而且龜含 A n u (*) > 0. 

假设 (2.6) 对 A : = 0,…, n 成立.由 (2.2), 多项式 B n , u 的系数是非负的，并且 
(2.1) 说明 B n , u ( l ) = 1. 因此， B n , u 是一个概率母函数，第1卷第11章（或下面的 
8.6 节）的连续性定理保证 S „, u 的极限《是一个概率母函数.（假设 u ( l ) = 1保证 
系数相加等于 1.) 这就完成了对有界函数的证明. 

如果 IX 在1附近是无界的，那么我们令 

v ( x ) = u ( m : i j ：) j u ( m : . 0 < a : < 1， (2.7) 

其中 m 是任意 整数. 上述的证明适用于并且说明了性质 （2.5) 和 (2.6) 的毎一个 
都蘊含幂级数展开式 (2.4) 至少对 l )/ m 成立.由于幂级数表达式的 
唯一性和 m 的任意性，这盘含 (2.4) 对0< a : < 1成立. ► 


7.3 矩问题 

在上节最后一个定 理中我 们遇到了各阶的差分均为正的数列 { a fc }. 在本 节中, 
我们将讨论一类有关的数列，它们的差分的符号是交替的，即使得 


(-l) r A r c fc > 0, r = 0,l,- 


(3.1) 
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的数列 {Ckb 我们称这样的数列为完全 单调的數列. 

设 F 是 ft 中的一个概率分布，并用 E ( u ) 表示 u 关于 F 的积分.我们把 F 
的 fc 阶矩定义为 

c fc = E ( X fc ) = x k F{dx}, (3.2) 

我们认为积分区间是闭的. 

求逐次差分，我们得到 

(- l ) r A r c fc = E ( JT fc (l - X) r ~ k ), (3.3) 

因此矩数列 { c *} 是完全单调的.现在设 u 是 p 中的任一连续函数，并把伯因斯 
坦 （ Bernstein ) 多项式 B n , u 的表达式 (2.1) 关于 F 积分.由 （3.3), 我们得到 

E ( B „, u ) = = u ( jh ) pf\(h = n - 1 ). (3.4) 

i=o j=o 

其中，为了简略起见，我们设 

pS n) = (3.5) 

对于 u (*) = 1这一特殊的选择，我们有 B n , u (x) = 1对所 有的: r 成立，因而相 
加后等于 1. 这表示，对于每个 定义了 一 个对点 jA = j/n 賦予重量 d n) 的概 
率分布 (这里 j =0,”.， n ). 我们用 F „ 表示这个概率分布，用 E „ 表示关于它的期 
望.于是 (3.4) 化成 E „( u ) = E ( S „. tt ) •由于 B n>u -* u 是一致的，所以 

E „( u ) -* E ( u ). (3.6) 

到现在为止， { Cfc } 是相应于一个给定分布 F 的矩数列.但是，我们可以从任一 
完全单调敷列 { c *} 出发，再用 （3.5) 定义由定义，这些贵是非负的，我们着手 
来证明它们的和等于 cq _ 实际上，根据基本的互反公式 （1.8), 

E ti O ' h ) Pj n) = ^ Cr ^/ i r A r ti (0). (3.7) 

对于常值函数 u = l, 右边化为 co, 这就证明了断言. 

因此，我们看到，服从正规化条件勿=1的任一完全单调数列{办}都定义一 
个概率分布 { p ( n ) }, u 关于它的期望 E „( u ) 由 (3.7) 给出.看一看当 n — oo 时发生 
什么情况是很有 趣的. 为了简单起见，设《是一个 iV 次多 项式. 因为 A = 1/«，所 
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以不难看出 f u ⑼-» u( r > ⑼.此外， n(n-l) - (i»-r+ l ) h r -* 1. (3.7) 中右边的 
级数至多包含 JV +1项，因此我们知道，对于每个 iV 次多项式，当 n — oo 时 

N 

E„(ti)-52^«M(0). (3.8) 

特别地，当 tt(a:) =*• •时，我们得到 

E n ( X r ) -»tv. (3.9) 

换句话说，概芈分布 F„ 的 f 阶矩超于 Cr. 因此，似乎应该存在一个 》■ 阶矩和 tv 重 
合的概率分布 F. 我们把这叙 述为： 

定理1 一个概芈分布的矩（V构成一个涡足勿=1的完全单调 數列. 反之，服从 
正規化条件 C0 = 1的任一完全单调數列 {c t } 与唯一的一个概芈分布的矩敷列重 
合. 

这个结果应归功于棄斯多夫 (Hausdorff), 这是一个深刻而又强有力的结果.泛 
函分析的系统应用逐渐导致了简单的证明，但是即使最好的纯分析证明也是相当 
复杂的.这里的处理方法是新的，它说明概率论的方法可以简化复杂的分析论证， 
并使其变得更加 直观. 我们不仅要证明这个定理，而且还要给出 F 的明显表达式. 

我们由 (3.8) 知道，对于任意的多项式 tx, 期望 E„(u) 收敛于一个有穷的极限. 
由一致逼近定理 (2.3) 可以推出，对任何在V中连续的函数 u 都有同样的结论成 
立.我们用 E(«) 表示 E„ ㈦的 极限. 那么关系式 (3.6) 在任何情况下都成立，但是 
如果从任一完全单调数列{岛}出发，我们必须证明，0存在这样一个概率分布 
使得极限 E(u) 与 u 关于 F 的期望重合. 

对于给定的0 < t < 1和 e > 0,用 ut, e 表示定义在 H 上的下列连续函 
数， 当;!^>« + £ 时它等于0,当0：<4时它等于1,而在 i 和 t + e 之间它是线性 
的.设 U t ( t ) = E t ( u tlt ). 如果 t < t , 那么显然有 ut, e<UT „ ，差 u T ,«-«t,« 的最大值 
< (r-t)/e. 由此推出，对固定的 e > 0, 队⑺是 * 的连续不减函数.此外，对于固 
定的当 e — 0时，值仏⑷只能减少，因此 U t ( t ) 趋于一极限，我们用 F(t) 表示 
此极限.这是一个从0变到1的不减函数.它显然是右连续的, ® 但这是不重要的； 
因为在任何情况下，改变 F 在其跳跃点上的值，我们就能得到右连续性. 

①我们可以在这里结朿证明，因为这个断言包含在本书中别处证过的以下两个结*的任一个之中. 

⑷包含在 5.1 节的里斯表现定理中，因为 E(u) 显然* 一个范为1的正线性泛函. 

(b) 包含在 8.1 节的基本收敛定理中. 

我们之所以给出这里的证明（部分地重复了 5.1 节中的证明)，是为了使本章自给自足，也是为了推 
导一个反濟公式. 

® 关于验证，见 5.1 节中的里斯表现定理的证明. 
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对于概率分布 (3.5) 的分布函数 F „, 由 u t , e 的定义，我们有，如果5 > e , 那么 

E n { XH - S ^) < F n { t ) ^ (3.10) 

当 n — oo 时，两端的项分别趋于 C/ e (t - (5) 和 U e ( t ). 如果 f 和 f - <5都是 F 的连 
续点，那么令 e — 0 我们可以得到，数列{凡⑷}的所有极限点都位于和 
F ( t ) 之间.最后，令6 0,我们得到，对于 F 的每个连续点 t , F n ( t ) ^ F(t). 这个 
关系式可明确地表示为 


E (")(-l) n_i A n -^-F(t). (3.11) 

对于 r > 1, 通 过分部积分我们可把的 r 阶矩写成形式 

E„(X r ) = l-r j 1 x r ~ 1 F n (x)dx. (3.12) 

我们在 (3.9) 中巳经证明了左边趋于〜，因为所以这就证明了 P 的 r 阶 
矩和 G 重合.这就完成了定理1的证明. ► 

注意，如果 F 是 *5 TT 中的任一概率分布函数，那么 (3.11) 是用 F 的矩来表示 
F 的反演公式.我们把这重新叙述于下列定理中. 

定理2 对于定理1的蜓 率分布极 fit 公式 (3.11) 在每一个连续点上部成立. 


为了避免误解，应当指出，对于不集中在某个有限区间上的分布，情况是完全不同的. 
事实上，一般说来，分布不是由它的矩唯_螭定的 • 

例对歎正态分布不由它的矩螭定.称正变量 X 限从对败正态分布，如果 lnX 脤从正态 
分布.对于标准正态分布， A ： 的密度为 

/ ⑻ = i>0, 

并且对于 * < 0,/(*) = 0.对于 一1 < a < 1,设 

fa(x) = f(x)[l + asin (2 nlnz )]. (3.13) 

我们断言，/。是一个与/有完全相同的矩的概率密度. 因为厶 > 0,所以只需证明 
J x */( x )8 in (2« lna:)dx = 0, fe = 0,1, • • •. 

代换 lna : = t = v + *, 把上面的积分化成 

去 / I ' - 卜—库 = ㈣ 办， 
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因为被积函数是一个奇函数，所以最后这个积分等于 0. (这个有趣的例子应归功于海得 
(Heyde). ) ► 

不应当由于这个否定性结果而过度悲观，因为适当的正则性条件可以消除产生这种困 
难的根源.最好的结果是卡莱曼 (Carleman) 定理.这个定理说明，如果 

5：^-™ = oo , (3.14) 

即如果左边的级数发散，那么定义在=55^5上的分布 F 由它的矩嘈一确定.在本书中，我 
们将只证明一个较弱的结果，即当幂级数 EMant"/(2n)! 在某个区间中收敛时， F 由它的 
矩唯一确定_ (7.6 节和 15. 4 节 •） 两个准则都对 心 的增加速度加了限制.即使在最一般的 
情 况下. 我们也可以根据有限多个矩 灿,/*1, …, 如 的知识来推导一些关于 F 的有用的不 
等式，这些不等式与在 5.7 节中根据 / io ./ x . 导出的不等式类似.① 


* 7 . 4 在可交换变置中的应用 

我们着手推导一个（应归功于徳 • 菲内蒂）瀑亮结果，它可以作为能很容易地 
从 7.3 节定理1推出的出人意料的结果的典型例子. 

定义称随机变量 &,•••, 是可交換的 ®, 如果 n ! 种置换有相同 
的 n 维概率 分布； 称无穷序列 { X „} 的变量是可交換的，如果对每个…, X „ 
是可交换的. 

下列例子将说明，在有穷序列和无穷序列之间有本质的 差别. 我们这里考虑 
只取值 0 和 1的 可交換变量无究序列 { X „} 的特殊情形.下一个定理断言.这样一 
个过程 { X n } 的分布可以通过把二项分布随机化得到.与通常一样，我们设= 
Xi + --- + X n , 把事件 { X * = 1} 解释为成功. 

定理对于每一个由只取值0和1的可交換变量 ; r „ 纽成的无穷序列，有一个相 
应的集中于5^1上的概芈分布 F , 使得 

P{Xi = x k = l,Xfc+i = 0,… ， X„ = 0} = /V(l - 0) n ~ k F{de}, (4.1) 


①最初的比较深 《 的结果是马尔可夫和斯薷尔切斯大灼在1884年得 M 的.最近关于这个问《的文歒 
非常多.例如见 A. Wald, TVans. Amer. Math. Soc., vol. 46 (1939) pp.280-306; H. L. 
Royden, Ann. Math. Statist., vol. 24(1953) pp.36I-376 [给出了 F(x) - F(-x) 的用.关于 
综述，见索哈特 （J. A. Shohst) 和塔马金 （J. D. Tamarkin) 的专著 ■ 77>e problem of moments, 
New York, 1943(Afa(/i Surveys, No.l). 又见 S. Karlin and W. Studden (1966). 

* 后面用不到本节的内容. 

® 有时也用 U 称相关”这一术语. 
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P {5„ = k } = (^j 0) n ~ k F { d 0}. (4.2) 

证为了简洁起见，用 P *,„ 表示 (4.1) 的左边（其中0彡 * 彡 n ) •令 co = 1,对于 
n = •，令 



Cn = Pn,n = P{^1 = = 1}. 

(4.3) 

于是由概率意义有 

Pn—l,n = Pn—l,n —1 一 Pn,n = — 1» 

(4.4) 

因此 

Pn—2,n = Pn—2,n—1 — Pn—l,n = 2 - 

(4.5) 

按这种方式继续下去，我们得到，对于 k ^ n . 



Pfc.n = Pfc,n-1 - Pfc+l,n = (-l) n-fc A n-fe Cfc. 

(4.6) 


所有这些董都是非负的，因而序列 { c „} 是完全单调的.由此推出，〜是一个概率分 
布 F 的 f 阶矩，因此 (4.1) 只不过是关系式 (4.6) 的另一种形式.断言 (4.2) 巳包含 
在它里面了，因为在 n 次试验中发生次成功的方式有 种. ► 

推广不难把同样的论证应用到可取3个值的变 最上， 但是那样的话就有2个自 
由参数，代替 (4.2), 我们得到三项分布与一个二元分布 F 的混合.更一般地，这个 
定理及其证明也适用于只取有限个值的随机 变馕. 这个事实自然会导致下列 猜想， 
最一般的对称相关序列{^}可以通过把某一独立变贵序列的一个参数随机化得 
到.个别情形是不难解决的，但是一般的问埋却呈现出了其固有的困难，即“参数” 
不是完全确定的，可以以任意的方式 选取. 尽管如此，还是有人在相当一般的情况 
下证明了这个定理的一种形式 .① 

这个定理使把大数定律和中心极限定理应用于可交换变董这件事成为可能的 
了.（见 8.10 节中 的习题 21.) 

下列例子将说明，在个别情况下，这个定理可以导致出人意料的结果.其他的 
例子将说明这个定理不适用于有限序列. 

例 （ a ) 在第1卷 5.2 节的 波利亚罐子模型中， 罐子最初装有6个黑球和个红 
球. 每次取出一个球后，把取出的球放回，并把 c 个与取出的球颜色相同的球加入 

① E. Hewitt and L. J. Savage, Symmetric measures on Cartesian products, IVans. Amer. 
Math. Soc., vol. 80(1956) pp.470-501. 在洛埃韦 (1963) 中可以找到利用鞅对这个问 《 所做 
的讨论.又见 H. Bfihlmann, Austauchbare Stochastiche Variabeln und ihn GrenzwerUatze, 
Univ. of California Publications in Statistics, vol. 3, No. 1(1960), pp.1-36. 
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罐子中.因此，在前 n 次取球时都取得黑球的概率等于 


6(6 + c ) • • • (6 + (n — l ) c ) 
(6 + r ) … (6 + r + (n — l ) c ) 


纖 


(4.7) 


根据第 n 次取球时取得的是黑球或红球，令= 1或0■第1卷 5.2 节中的简 
单计算表明，这些变董是可交换的，因此 h 表示一个分布 F 的 n 阶矩. (4.7) 的形 
式使我们想起了 2.2 节 (2.5) 0 积分.观察表明， F 是带有麥数 m 和《 = r/cW 

2.4 节 (4.2) 冷分布.再利用冷积分，可以看出， (4.1) 与第1卷 5.2 节 (2.3) 一致， (4.2) 
与第1卷 5.2 节 (2.4) 一致. 

例 （ b ) 考虑2个球在3个盒子中的6种可辨别的分布，并对每种分布賦予概率 
i 根据第 i 个盒子中有球或无球，令等于1或 0. 变董是可交换的，但定理不 
适用.实际上，由 (4.3) 我们可得 C 0 = l lCl = 1,02 = ^03 = 0,序列到此停止.如 
果它是一个完全单调序列 { c „} 的初始部分，那么我们应有 C 4 = C 5 = ••• = 0.但 
是，这样就有 A 4 Cl = - i <0, 这与 { c „} 是完全单调序列相矛盾 • 

例 （ c > 设 A ，…,是独立同分布的，并令= A + .p + Xn . 对于 fc = 
1,2, 4 h = Xfc - r »- Wn . 变董 （ Vi , …， Kq ) 是可交换的，但它们的联 
合分布不具有德；菲内蒂 （de Finetti ) 定理指出的那种形式_ ► 


*7.5 广义泰勒公式与半群 

前面3节讨论了涉及二项分布的 7.1 节例 （ a ) 中的极限关系式的推论.现在我 
们来讨论涉及泊松分布的 7.1 节例 （ b ). 因为这个分布是二项分布的一个极限形式， 
所以我们可以希望，我们对伯因斯坦多项式的简单处理方法可以推广到目前的情 
形.这种处理方法的起点是恒等式 (1.10), 二项分布出现在此式的右边.如果我们令 
6 = x / v ； 并让 — 00 ,那么这个二项分布就趋于期望为 a ： 的泊松分布， （1.10) 变 
成① 

£ 7T Ar °< = e_ * £ (5. 1 ) 

r=0 j=0 

对 i = 0,4 = U{jh), 我们利用这个恒等式，其中 U 是0^3上的任一有界连续 

* 初读时可以略去本节. 

①为了直接证明恒等式 (5.1), 只需用定义表达式 (1.7) 代替厶*^就行了.这样左边变为一个二重 
和，右边可遂过它的项的明显的璽新株列得到. 
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函数，/»是一个正 常数. 令 : c =祕，关系式 (5.1) 变为 

右边是 U 关于泊松分布的期望，由例 1( b ) 知道它趋于 u (0). 为了以更自然的方式 
表示这个结果，我们把 t !(0) 换为 u(e + t ), 其中 t > 0是任意的.因此我们证 明了： 
定理 对于0^3上的任 一有界 连埃* 數 u, 

f ^^ A r u ( t )-* u(t + ff ). (5.3) 

这 > 0, / i 0+. 

这是一个极其吸引人的定理，希尔 ( HUle ) 首先用较髙深的方法给出了证明.左 
边是 u 的泰勒展开式，只是这里把导数换成了 差商. 对于解析函数，左边趋近于泰 
勒级数，但是此定理也适用于不可微函数.在这种意义下， （5.3) 是泰勒展开式的推 
广，并揭示了它的本质的新的方面. 

还可以用另外一种方法考察 (5.3), 这种方法将导致所谓的半群理论的指数公 
式（见 10.9 节的定理 2). (5.3) 的左边包含一个形式上的指数级数，用它来定义一 
个算子 exp 是很自然的.这样关系式 (5.3) 可以简写为 

exp 0 A u ( t ) -»«(t + 0). (5.4) 

为了更一致地用算子来记上式,我们弓 I 进一^平移算子® r ⑻,它把 t * 变成由 u e ( t ) = 
«(< + «) 定义的函数 抑. 于是 T (0) = 1是恒等算子，并且 

A = h -^ h ) - 1]. (5.5) 

利用算子的语言， (5.3) 现在变为 

e eh-HT{h)-i) _ r ⑼. ( 5 . 6 ) 

①应当注意，如果0和 h 是负的， ！• 是定义在全直线上的，那么这里的论证仍然成立. 

® 这是 E. Hills and R. S. Phillips, Functional analysis and semi-grtrupa, AMS Colloquium 
PublicationB, vol. 31(1957) p. 314 中（在稍徽更一鉸的情形下）给出的 证明. 此证明应 fi 功于 
里斯，不用说，作者们不认为把线性播值 (5.7) 当作半屏参数的泊松随机化是有用的，也不认为把 
切比雷夫多 壤式# 成是当然成立会有什么用处. 肯 达尔注意到了它的*率含义，在 K. L. Chung, 
On the exponential formulas of semi-group theory, Math Scandinavica, vol. 10(1962) pp. 
153-162 —文中充分地利用了它的*率 含义. 



7.6 拉普拉斯变换的反演公式 203 


这个公式所包含的主要信息是，整个算子族 r (0) 由于很小的/0的性质所 
确定. 

回顾一下可以看出，我们对 (5.6) 的推导显然适用于更一般的算子族. （5.2) 的 
右边只是 u 的值的一个线性组合，可以看作是 u 的插值公式.类似的插值表达式对 
于定义在0 > 0上的毎个算子族 { T {0)} 都有意义.实际上，对于固定的0和 h > 0, 
算子 

A h {0)= e - 9 h - 1 '£ U ^) k T ( kh ) (5.7) 

k=0 ' ^ 

是算子 T(kh) 的一个加权线性 组合. 权由泊松分布给出，并且当 - 0时，0的一 
个邻域占优势，其余部分的权趋于 0. 因此，似乎应有下面的结论成立：利用收敛性 
和连续性的任意的合理概念，对于任一连续算子族 r ⑼，我们应有烏⑼ -» r ⑼. 
特别地，如果算子 T(0) 构成一个半群，那么我们有 T(kh) = {T(h)) k , 插值算子 
烏 W 与 (5.6) 左边出现的算子 相同. 因此，“指数公式 "(5.6) —般说来对有界算子的 
连续半群成立这件事不是出人意料的.我们将在 10.9 节中再来讨论这个证明. 


7.6 拉普拉斯变换的反演公式 


7.5 节和 7.1 节例 （ b ) 是以下面的大数定律的一个特殊情形为基 础的： 如果 
X 是一个随机变贵，且服从期望为从的泊松分布，那么对于充分大的 A , 寧件 
1^- - X 0\ > Xe 的概率很小.因此，对于 P{X ^ Xx }, 我们得到，当 A — oo 时， 


•AO ( A ^ — 0，如果 0 > 

1，如果 0< ar . 


( 6 . 1 ) 


左边的表达式是 （5.2) 在 u 只取值0和1时的一个特殊情形，因而 (6.1) 包含在上 
节的定理中.我们现在用对拉普拉斯变换的应用来说明这个公式在分析中的用途， 
拉普拉斯变换这个课题将在第13章中系统地讨论. 

设 F 是一个集中在0^5上的概率分布 • P 的拉普拉斯变换是一个定义在 A > 0 
上的如下的函数¥»， 

V »( A )= re ~ xe F { de }. (6.2) 

Jo 

导数存在，且可通过形式微分得到： 

(-l)V fc) (A) = J^° e- xe e k F{d0}. (6.3) 
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由这个恒等式和 (6.1) 可以看岀，在 F 的每个连续点上, 

尸⑻. 


(6.4) 


这是一个非常有用的反演公式.特别地，它说 明分布 F 由它的拉普拉斯变换哞一 
确定. 

同样的论证可导致很多与上述公式有关的反演公式，这些公式可应用于各种 
各样的情况.事实上， (1.6) 是具有下列形式的拉普拉斯积分的一个反演公式 * 

tu ( A ) = f e - Ax u ( i ) dx . (6.5) 

Jo 

与在 (6.3) 中一样，可以进行形式 微分. (1.6) 说明， 如果 u 是一有界连读兩数，那 
么在每个有限区间中一致地有 

tari(n) n „<-')(„/ 8) (6.6) 

[这些反演公式在更广泛的条件下也成立，但是在这个时候让新的术语掩兼论 
证的简明性是不太好的 .（6.6) 的一种抽象形式将出现在 13.9 节中 . 1 
如果分布 F 具有矩 / il ,• • ^2„,那么它 的拉普拉斯变換满足不等式 

fc =0 k=0 

这是一个常用的不等式.为了验证上式，我们从下列著名的不等式 ® 出发： 

2 E^<e-*<E^r. -0. 

k=0 k=0 


(6-7) 


(6.8) 


把 < 换为 At 并关于 F 积分，就可得到 (6.7). 特别由此推出，在使下式右边的级数 
收敛的任一区间 0< A < Ao 中， 




(~ l ) V fc A fc 


(6.9) 


由解析函数论知道，在这个情形下，对于所有的 AX ), (6.9) 中的级数唯一地确定 
了 p ( A ). 因此，当 (6.9) 中的级數在某一区间 | A | < Ao 中收敛的时候，矩 Mi , M 2,". 
唯一地确定了分布广 这个有用的准则对于不集中在0755上的分布也成立，但是 
证明要用到特征函数（见 15.4 节). 

® 根据归纳法，由简单的微分可证明 （6.8) 中任意两项之差是 t 的单调函数. 
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*7.7 同分布变量的大数定律 


在本节中，我们利用记号= + ••• + &. 大数定律的最古老的形式是指, 
如果 Xfc 独立，且具有期望为/X，方差为有限的共同分布，那么 ® 对于固定的 e > 0, 
当 n —♦ oo 时， 

Pdn-'Sn il > £ 卜 0. (7.1) 


本章是从下列陈述开 始的： (7.1) 包含在切比雪夫不等式中.为了得到更深刻的结 
果，我们来推导一个即使在期望不存在时也可应用的切比雪夫不等式的变形.根据 
X k 在任意固定的水平±知上的截尾来定义新的随机变最 X ；；.于是 


令 

那么很明显, 


X' k J X ^ 

\x k \ < 

(7.2) 

1 0. 

^ *n- 


s; = ^ + ...+x; f 

m ； = E(5；) = nE(X0, 

(7.3) 

P{|S n -m ； |>t><P{|Sj, 


(7.4) 


因为只有当右边的事件之一发生时，左边的事件才可能发生. 

这个不等式对于具有不同分布的相依变量也成立，但是我们这里只对同分布 
的独立变筐感兴趣.令 t = nx 并对右边第一项应用切比雪夫不等式，由 （7.4) 我们 
可得到下列的 

引理设是具有共同分布 F 的独立变量.那么对*>0, 

P {|^ n - E (^)| >* J < -^ E ( X ^) + nP {| X !| > «„}. (7.5) 


作为一个应用，我们可以推导辛饮大數定律，辛钦大数定律是说，当 X fc 具有 
有限期望//时， (7.1) 对所有的 e > 0 成立. 它的证明在本质上是第1卷 10.2 节中 
给出的离散情形的证明的重复.因此，我们来直接讨论一个包含充要条件的更强的 
形式.为了用公式表述它，对 t >0, 我们令 


r ( t ) = [ l - F ( t ) + F (- f )] t , (7.6) 

• 本节的髁颶与最古老的*率论有关，但在本书的其余部分中没有什么特别的重裏性.之所以叙述它 
们，是由于它们的历史意义和方法论的意义.也是因为有许多论文专门讨论大数定律的部分逆. 

® (7.1) 等价于 n^Sn - 其中表示“依槪率趋于 ”.（ 见 8.2 节 .） 
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a(t) =、 j x 2 F{dx} = —r(i) J xr(x)dx. (7.7) 

(这两个表达式相等可通过分部积分得到 .） 

定理1 广义弱大數定律.设是具有共同分布 F 的独立变量.为使存在这样的 
常数使得对每个 e >0 有 

P{|n- 1 S„-/ in |>€}-0, (7.8) 

当且仅当 ®*-»oo 时 t ⑷ — 0. 在这种情形下， (7.8) 对于 

Mn = ^ xF{di} (7.9) 


成立. 

证⑷充分性•用 (7.9) 定义叫. 我们利用满足 a = n 的截尾 (7.2). = f ^^ n = E ( X [), 
由上一引理知 (7.8) 的左边< e - V ( n ) + r ( n ), 当7■⑷ — 0时，此式趋于 0. 因此， 
这个条件是充分的. 

( b ) 必要性.假设 (7.8) 成立. 与在 5.5 节中一样，我们引入由的对称化直接 
得到的变贵 ° X k . 它们的和 D S „ 可以通过的对称化得到.设 a 是变童 X * 
的一个中 位数. 依次利用 5.5 节的不等式 (5.6), (5.10) 和 （5.7), 得 

2 P {|5„- n / i |> nc } ^ P {|° S „| > 2 ne } 

> i [ l - exp (- nP {|° X 1 |>2 n C })] 

^ \ [ 1_ex P >2 ne + | a |})] • 

由 (7.8), 上式左边趋于 0. 由此推出，右边的指数趋于0,因此必有 T ( t ) -»0. ► 

当 F 的期望为 M 时，条件 t ⑴- ► 0是满足的.于是截尾矩趋于 / x . 因此， 
在这种情形下， (7.8) 与古典大数定律 (7.1) 等价. 但是，形如 (7.1) 的古典大數定律 
对某些期望不存在的变量也成立.例如，如果 F 是一个使得 t [ l - F ⑻】 —0 的对称 
分布，那么 Pdn-^nl > e } - 0. 但是，只有当1 - F ( t ) 在0^5上可积（这是一个 
较强的条件）时，期望才存在. 

(有趣的是：强大数定律只对期望存在的变量成立.见 7.8 节的定理 4.) 


在第 1 卷第 10 章中讨论了大数定律的经验意义，在那里特别注意到了 “公 平緒博 "的 
经典理论.特别地，我们 已看到,即使在期望存在时，“公平緒博 " 的一个参加者也可能强 
①由 (7.7) 推出， r(t) — 0 蕴含 <r(t) — 0. 其逆也是正 •的； 见习 * 11. 关 于定理1的另外一种证 
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烈地处于输的一方.另一方面，对彼得堡赌博的分析说明，古典理论也适用于一些期望为无 
限的醏博，除了 “公平的入 场费”将依赖于要参加的试验次数以外.下述定理使这个叙述更 


我们考虑具有共同分布 F 的独立正变量 X *. [因此 J ^ O ) = 0.] X fc 可以看作是可能的贏 
利，可以看作是参加《次试验的总入 场费. 我们令 


吣） / o X F { Ax }, 

(7.10) 

定理2 存在这样的常数 a „, 使 


pWa * -1| > «} — 0 

(7.11) 

的充要条件是①，当 S -* oo 时， P ( a ) oo . 在这种情形下，存在这样的敷 

使得 

Tin ( 8n ) = 8n , 

(7.12) 

并且 (7.11) 对 a „ = r » M (» n ) 成立. 



证⑷充分性.设 p ⑷- ► oo . 对于很大的 ti , 函数 n M ( a )/ 8 所取的值> U 但是当 
« — oo 时，它趋于 0. 函数是右连续的，并且左极限不可能大于右 极限. 如果知是所有使 
得 n / i ( s ) s - 1 < 1的 • 的下界，那么 (7.12) 成立. 

设 Mn = M ( s «) = E ( X {). 我们利用引理中的不等式（ 7 . 5 )(其中 a : = «如）可得 

P { I 衾 _1 卜卜 ^ E(X?)+ " 11 - F (*")】. ( 713 ) 

通过分部积分可以把 E ( Xf ») 化成一个被积函败为: rll - FOr )】 的积分.由假设 函败: r [ l - F ( a :)] 
是 o ( n ( x )). 因此. Epf ?) = 0(知如)，由 (7.12) 知道这表示 (7.13) 中右边第一项趋于零 
类似地， (7.12) 和 〆 a ) 的定义 (7.10) 表明 n【l - F ( a „)) 0. 这样 (7.13) 就化成了带有 

On = n/ln 的 (7.11). 

( b ) 必*性.我们现在偁设 (7.11) 成立，并利用满足= 2 a „ 的截尾 （7.2) •因为 
B ( JVl a ) < a n ^ n , 我们由带有 a : = eon / n 的基本不等式 (7.5) 得到 

P{Sn > nfin + «On} < -+ n [l ~ F(2an)]. (7.14) 

因为我们讨论的是正变置，所以 

P{5„<2o„}<P{^^X“2a„} = F n (2a„). (7.15) 

由假设，左边趋于0,这蕴含 n [ l - F (2 o „)]-» 0( 因为对于 x $ l , x ^ e -( l -»)). 如果 nun / or , 
趋于0,那么 (7.14) 的右边也趋于0,这个不等式显然与假设 (7.11) 矛盾.这个论证也适用 
于子序列，并且说明 nun / an 都取0以外的有界值；这又龜含 p ( 2an ) - 00 . 

①在 8.9 节（定理 2) 中将会看到， 〆 》) - oo 的充》条件是 /*(*) 在无穷远点缓慢变化.关系式 
(7.11) 等价于0^5„ 上1{* 8.2 节). 



208 苐 7 幸大數定律，在分析中的应用 


为了证明当 x 以任何方式趋于 oc 时都有 p 0) 一 00,我们选取这样的 o „， 使得 2 a „ < 
2an + 1 . 于是 p ( x )> (2 o „) o „/ a „ + I . 显然，为使 (7.11) 成立，必须保证 On + i / a n 是有界 
的. ► 


*7.8 强大数定律 


设 X U X 2 ,- - 是具有共同分布 F 的相互独立的随机变董，且 E ( X k ) = 0 . 我们 
照例令 S r , = X 1 + -.- + X n . 弱大数定律说明，对于每个 e > 0, 

P { n -1 |5„|> e }-0. (8.1) 

这个事实并不排除 n -* S „ 对于无穷多个 n 变成任意大的可能性.例如，在对称随 
机游动中，质点在第 n 步通过原点的概率趋于0,而且确实要通过原点无穷多次. 
在实际中，我们对当 n 为任一特别大的值时 (8.1) 的概率不怎么感兴趣.更有趣 
的问题是， n ~ l \ S n \ 是否最终变成并保持很小？即是否对于所有的 n > JV 同时有 
n - 1 氏| < «?因此，我们想知道事件®^ 1 ^ — 0的概率. 

如果这个事件的概率为1,那么我们称 { X fc } 服从强大数定律. 

下一个定理将说明，当 E (；^) = 0时，情况是这样的.[这个陈述比弱大数定律 
强得多.这可由下列事实 推出： (8.1) 对一些期里不存在的序列 { X fc } 也成立.相反， 
期望的存在性是强大数定律的必要条件.事实上，将在本节的末尾讨论的强大数定 
律之逆说明，在期望不存在的情况下，均值—定无穷多次地超过任一预先 
指定的边界值 a .] 

定理1 强大數定律.设 XhXa , …是独立同分布变量，且 EpCGsO . 那么以板 
芈 1 有 n^Sn — 0. 

证明依赖于截尾，实际上与具有不同分布的序列有关.因此，为了避免重复，我 
们把证明推迟，而先建立另-个有广泛用途的定理来为此证明作准备. 

定理2 ，… 是具有任意分布的独立随机 变責. 倣设对于所有的 fc , E (&) = 
0,并且 x 

X ] E (52)< oo , (8.2) 

*=i 

那么序列 { S n } 以概率1收敛于一有穷极限 S . 

证我们利用由变 M X * 定义的无穷维样本空间.设 4( e ) 表示“不等式 |5„-5 m | > e 
对于某些任意大的下标 n ， m 成立”这个 事件. { S n } 不收敛这个事件是事件 4( e ) 在 
e — 0时的单调极限，因而只要证明 P {4( e )} = 0就行了•设 A m ( e ) 表示‘‘对某个 
"* 初读时可以略去本节 

①由 4.6 节的（VI律推出，这个*率等于0或1,但是我们将不利用这个亊实. 
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n > m ,|5„- S m |> e " 这个事件，那么 A ( e ) 是递减的事件序列 {4( e )} 在 m oo 
时的极限，因此只要证明 PiKe )} — 0就够了.最后，对 n > m , 令 ㈤ 是 
“对于某个 m < k < n ,\ S k - S m \>€ n 这个事件.根据科尔莫戈罗夫不等式 

P {^ m , n ( c )} < e - 2 Var ( S n - S m ) = e ~ 2 ^ E ⑽. (8.3) 

fe = m+l 

令《 — OO , 我们得到 ^ 

P { A m ( e )}^ e - 2 f ； E { X 2 k ). (8.4) 

当 m oo 时，右边趋于 0. ► 

这个定理有许多应用，下列定理是这个定理的一个被用来证明强大数定律的 
变形. 

定理3 设…是具有任意分布的独立变量.假设对于所有的 fc , ECY fc ) = 0. 
如果 6 l < i >2<...—» oo 且 

^6 j - 2 E ( X fc 2 ) < oo , (8.5) 

那么級数 ^ b ^ X k 以概牟1收致，而且 

b^Sn^O. ( 8 . 6 ) 

证第一个断言可以通过把定理2应用于随机变量 b : l X k 而立即得到.下列常用 
的引理说明，关系式 (8.6) 在使级数收敛的每个点上都成立，这就完成了证明. ► 

引理1 (克罗内克引理 •） 设 { x fc } 是任一数列，且0< 知 <& 2 <- » oo . 如果級 

數 Er 〜 办收敛，那么 

心 ' •广 " _>()• (8.7) 

证用表示我们这个收敛级数的余部.那么对于 n = l ,2, --, 

Xn = b n {p n -i - pn), 

因此 

Jl + + ^ = ~Pn + ^- 51 Pk 0> k +1 - b k ) + (8.8) 

设当 A ; > r •时， | pjk | < e .因为 — oo , 所以前 》• 项对总和的贡献趋于 0, 而其余各 
项的和至多等于 - br )/ b n < £. 因此 (8.7) 成立. ► 

在回到强大数定律之前，我们来证明另一个纯分析性质的引理. 

弓 I 理 2 设请变量&有共同的分布 F , 則对任 - a >0, 当且仅当 E ( X fc ) 存在时， 
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y^PdXfcl > a *} < oo . (8.9) 

证根据 5.6 节的引理2,当且仅当 


f [1 - F(x) + F (— i )] cLe < oo (8.10) 

Jo 

时，期望 E ( A -0 存在. 可把 (8.9) 中的级数看作积分的黎曼和，因为被积函数是单 
调的，所以关系式 （8.9) 和 (8.10) 是等 价的. ► 

我们现在能够来证明强大数定律 .® 

定理1的证明我们利用截尾法，定义新变量 如下： 


X' k = X k , X'i = 0, 如果 
X 卜 0, X '； = X k , 如果 > A :. 

因为存在一个有限的期望，所以由上一引理（令 a = 1) 可得 


( 8 . 11 ) 


^P{X^0}<oo, (8.12) 

这籩含，以概率1只有有穷多个变 M 不为 o . 因此，利用明显的记号，以概率1 
有 ^-0. 

其次，我们来证明 

^*- 2 E ( X 0< oo . (8.13) 

根据定理3,这邃含着以概率1有 

n- l [S f n -E(S' n )]^0. (8.14) 

但是0,因此显然有 


n- 1 E(5；) = n- 1 ^ ； E(X0-0. 

fc=i 

为完成证明，只剩下验证断言 (8.13) 了.由于 

E(^) = X! [ ^F{dx}, 


(8.15) 


(8.16) 


所以 


①关于一个更直接的证明，见习麵 12. 
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(8.17) 


(8.18) 


我们巳看到，形如 (7.8) 的弱大数定律也适用于一些期望不存在的序列.这与强大数定 
律形成明显对比， mi ) 的存在性是强大数定律的必要条件.事实上，下一个定理说明，在 
不存在有限期望的情况下，均值 Sn/n 的序列以概率1无界. 

定理4 (强大数定律之逆.…是独立同分布的变量.如果 E (| H ) = oo , 那么 
对于任一數列 {c „}, 以蜒率1有 

limsup | n -1 5 n - c «| = oo . (8.19) 

证令 / U 表示|心| > aA 这一亊件.这些亊件是相互独立的.由引理2,期望不存在蓮含 
EP {^> 发散.根据博笛尔-坎泰利第2引理（见第1卷 8.3 节)，这表示以概率1有无穷 
多个事件戊发生，因此序列 \ X k \/ k 以概韦1无界.但是，因为 X k = S k - S k - u 所以若 
| Sn |/ n 有界，则 \ X k \/ k 也有界.从而我们断言，均值 S „/ n 的序列以概率1无界 • 

这就对 c fc =0 这一特殊僧形证明了断言 (8.19), 一般惰形可通过对称化化为特殊情形. 
与在 5.5 节中一样，我们用表示对称化了的变量 X * •由 5.5 节对称化不等式可推出 
E (|° X fc |) = 00,因此均值的序列以概率1 无界. 但是。 S „ 可以通过把 S n - cn 对称 
化得到，因此 ， （5„ - cn)/n 为有界的概率是 0. • ► 

*7.9 向鞅的推广 

5.8 节 （ e ) 中的科尔莫戈罗夫不等式为 7.8 节的证明提供了主要的工具.细读 
这些证明可以看出，所假设的变童的独立性只是被用来推导一些期望的不等式，因 
而主要的结果可以搬到鞅和下鞅上来.这样的推广对许多应用是重要的，并且它们 
对我们的定理的本质作了新的说明. 

由 6.12 节知，称随机变 M t / r 的有穷或无穷序列构成一个下鞅，如果对于所有 

的 r , 

E (^ r |«8 fc ) > fc = 1,2, • • • , r - 1, (9.1) 

其中 ® i C ® 2 C …是一列递增的事件 ( T 代数.当把所有的不等式换为等式时，称 
{ Ur } 是一个鞅.1在每一种情况下，如果条件 (9.1) 对于特殊值 fe = r - l 成立，那 


E k ~ 3 E ( X ^) = £/ i<a< a : 2 ’} f >_ 2 . 


内层的和小于 2/ j , 因此右边小于 




larji^dx} = 


| a :| F { dar >. 


这就完成了证明. 


*后面各章用不到本节的内容. 
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么 (9.1) 中的 r - 1个条件都被满足 .] 我们还知道，如果 { X k } 是一列独立随机变 
量且 E ( X fc ) = 0, 那么部分和 S „ 构成一个鞅；此外，如果方差存在，那么{筘}是 
-个下鞅_ 

定理1 (正下鞅的科尔奠戈罗夫不等式 .） 设 14，…， t /„ 是正 变量. 假设对于 
它们满足下鞅的条件 （9.1), 那么对于 f >0, 

P { ma « l 7 fc > t } < t - l E { U n ). (9.2) 

如果 {14} 是一个任意的鞅，那么诸变量|以|构成一个下峡.（见 6.12 节中的 
引理）由此推出，定理1包含下列重要的 

系（鞅的科尔奠戈罗夫不等式).如果构成一个鞅，那么对子 t >0, 

P { max | l /*| > t }< (9.3) 

定理 1 的证明我们逐宇逐句地重复 5.8 节 （ e ) 中的科尔莫戈罗夫不等式的证明, 
所不同的只是把那里的均换为 lh . Sk 是独立随机变童之和这个假设只被用来建立 
5.8 节 (8.16) 不等式，此不等式现在可写为 


mnUj ) > mM ). (9.4) 

由于 k 是％可测的，所以 

E(U n l Aj \^j) = l Aj E(U n \*8j) ^ UjUj (9.5) 

[见 5.10 节 (10.9)]. 取期望，我们就得到 (9.4). ► 

我们转向 7.8 节无穷卷积定理的推广，虽然它只导致一般的鞅收敛定理的一个 
特殊 情形. 实际上，杜布曾证明，如果把条件 E (纪）< 00换为 E (|5 n |) 有界这个较 
弱的要求，那么下述定理仍然成立.但是，这个一般定理的证明是复杂的，我们之 
所以给出定理 2 ,是由于此定理的重要性和它的证明的简洁性.（关于一种推广，见 
习题 13.) 

定理 2 (鞅收敛定理)•设 {5„} 是一个无穷的鞅，并且对于所有的 n ， 有 E (硿）< 
c < oo . 存在一个随机变量使得以板牟 1 有 — S . 而且对于所有的 《, E (5„) = 
E (5). 

证我们重复 7 .8节中定理的证明 • S „ 是独立变置之和这一假设在 (8.3) 只被用来 
证明 


E((S„ - S m ) 2 ) — 0 ， n,m -M». 


(9.6) 



我们由 6.12 节知道， { S n } 的峡性质蕴含，对于 n > m . 
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E ( S „|5 m ) = S m . 

概据 5.10 节 (10.9) 条件期望的基本性质，这蕴含 

E ( S n S ro | S m ) = S ^, n > m . (9.7) 

取期望并利用 5.10 节 (10.10) 关于双重期望的公式，我们得到 
E ( S „ S m ) = E (5^), 

因此 

E (52-0 = E ( S 2)- E (^), n > m . 

但是由 6.12 节的引理，诸变董构成一个下鞅，因此序列 { E (玲) } 是单调增加 
的.由假设，它是有界的，从而它有有穷的极限.这茧含 (9.6) 是正确的.峽性质蕴 
含 E ( S „) 是与71无关的，等式 E ( S ) = E ( S „) 可由序列 { E ( S ^)} 的有界性推出 [8.1 
节例 （ e )]. ► 

作为一个直接的推论，我们得到如下的类似于 7.8 节定理3的 
定理3 设 { X „} 是这样一列随机 变量， 使得对于所有的 n . 



E ( X n | B n _ 1 )=0. 

(9.8) 

如果 … * 00, 并且 

X > j ： 2 E (功 < oo , 

(9.9) 

邠么以概牟 1 有 

x 1 + -.. + x n _ 0 

On 

(9.10) 

证容易看出，诸变童 


(9.11) 


构成一个鞅， E (的）以 (9.9) 中的级数为界.因此上一定理保证了 { t /„} 的几乎必然 
收敛性.由科罗内克引理，这蓮含断言 (9.10). ► 

例 （ a ) 在 6.11 节例 （ b ) 和 7.4 节例⑷中曾讨论 过波利亚蠓子 模型. 如果 K 是 
第《次试验后黑球的比例，那么已经证明了 { K } 是一个鞅，我们现在知道以概率 
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1存在一个极限 y = limy n . 另一方面，第 n 次试验时取得黑球的概率可以通过 
把二项分布随机化得到.因此，如果是前 r » 次试验中取得的黑球的总数，那么 
n ^ Sn 的分布趋于 7.4 节例⑷中的分布 R 由此推出，极限变量 y 服从0分 
布 F . 

例 （ b ) 分支过租. 在第1卷 12.5 节中 讨论过的分支过程中，第 n 代的总体大小 
X n 的期望为 E ( X n ) = 〆 *[见第1卷 12.4 节 (4.9)1. 假定第 （„ - 1) 代由 w 个个体组 
成，的（条件）期望是这与以前诸代的大小 无关. 因此，如果令 S „ = XJ ^, 
那么序列{5„}构成一个鞅.不难证明，如果 E ( X ?) < oo , 那么 E (贫）是有界的（见 
第1卷 12.6 节的习题 7). 这样我们得到了一个惊人的结果， S „ 以概率1收敛于某 
一极限 Soo . 特别地，这蕴含，的分布趋于 Soo 的分布.这些结果应归功于哈里 
斯 ( Harris ). 

例 （ c ) 调和* 數.为了淸晰起见，我们讨论一个特殊的例子，虽然下面的论证也 
适用于更一般的马尔可夫链与和谐函数 [6.12 节例 （ c )】. 

设 D 表示由满足彡1的点 z = ( n , x a ) 组成的 圆盘. 对于任一点 xeD , 
设 C * 是圆心在 a : 且包含在 D 中的最大的 圆周. 我们考虑 D 中的一个马尔可夫过 
程 { Y n }, 其定义如下.如果 K = a :, 则变童 r „ +1 在圆周 C 4 上是均匀分布的，假 
设初始位置 Y 0 = y 是已 知的. 转移概率由随机核 A ： 给出，对于固定的 a :, A ： 集中在 
C * 上，并在其上均匀分布.称 D 内的一个函数 u 是和谐的，如果 U (; c ) 等于 u 在 
c x 上的平均值.现在考虑一个在闭圆盘中连续的调和函数 u, 那么{«%)}是 
一个有界鞅，因为 Z = lim «( y n ) 以概率1 存在. 因为坐标变世％是调和函数，所 
以以概率1趋于一个极限 YeD . 容易看出，此过程不能收敛于 D 内的点，因 
此以概芈1超于 Z ) 的边界上的一点 y . 

这类论证的扩张可以用来研究马尔可夫过程的渐近性质，也可以用来证明有 
关调和函数的一般定理，比如有关径向的边界值几乎处处存在的法图定理.① ► 

7.10 习 题 

1. 如果 U 在5^3中是有界且连续的，那么当 n — oo 时，在毎个有限区间中一致地有 

£ ( n r ) ( it^ w (占)一 u ⑴. 

提示 I 回忆第1卷 6.8 节的嘴二项分布"，不必进行计算. 

2- 如果 tx 有连续导数 ti ', 那么 B n , u 的导败逆„,„ 一致地趋于 

① M. Brelot and J. L. Doob, Ann. Inst. Fourier, vol. 13(1963) pp. 395-415. 
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3. R 2 中的伯因斯坦 （ Bernstein ) 多项式.如果 «( i , y ) 在三角形 x > 0, y > 0, x +y ^ 1 
中是连续的，那么一致地有 

4. 在 "57? 中连续的函数 11 可以用偁多项式来一致逼近.如果 u ⑼ = o , 那么也可以用奇 
多项式一致通近 .① 

5. 如果 u 在区间0^中连续，并且 «( oo ) 存在，那么可以用 e -~ 的线性组合一致地逼 
近 u . 

6. 对于下面给出的3个矩序列，求 (3.5) 中的概率 pi n ) . 利用极限关系式 (3.11) 求相应 
的分布厂 

( a ) fin = p n (0 < p < 1), ( b ) Mn = ( c ) Mn = - 

7. ® 设 p 是一 ^ 1； 次多 项式. 证明，当> v 时， fp 恒等于 0. 因此， B „. p 是一个次数 

的多项式（尽管它形式上是一个次败 n > v 的多项式 .） 

8•当 F 有密度时， (6.4) 可以通过 (6.6) 的积分来推导. 

9. 平稳序列的大數定律 .设 { X fc }(fc = 0,± l ,±2,...) 是一个平稳序列，与 (7.2) 中一样用 
截尾法来定义 Xi . 如果 E ( X *) = 0,且当 n — 00时， E (* J , x ；) = 0,那么 

Pfrr 1 % + …+ X„| > «} — 0. 

10. 设 X * 是独立的，并如在 (7.2) 中那样用截尾法来定义令 a „ - 0,且假设 

E 寧 *1 > Sn }^0, a - 2 f } E (：0 — 0. 

k=l k=l 

证明 

P||sn- |^E(Xi)| > £0„ 卜 。. 

11 •(与 7.7 节定理 1 有关）证明 （ T ( t ) — 0蕴含 r ( t ) — 0. 提示，对于充分大的 * 证明 
t 、 x 、- ^ r (2 x ) < e . 逐次应用这个不等式于 x = t ,2 t ,4 t ,-■ 可得 t (*> < 2 e . 

12. (强大 数定律的直接 证明）利用 7.8 节定理1的证明中所用的记号,对于 2 r < fc 彡 2 r+1 , 
令 Z r = max | Si |. 利用科尔莫戈罗夫不等式证明 


①一个应归功于缪茨 （H. Ch. Muntz) 的著名定理断言，可以用 l,* n i,* n V. •的线性组合一致逼 
近的充 R 条件是 ZnJ ； 1 发 •. 

® 利用这个结乘可大大简化矩问題的古典解（例如在索哈持和塔马金的书中). 
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5^ P ( Z r > e 2 r )< oo . 


这遂含强大数定律.（这个证明不必用到 7.8 节的定理2和定理 3.) 

13. (下鞅的收效定理） 证明 ， 只要对于所有的 k , U k > 0 , 那么 7.8 节的定理2也适用于下 
鞅. 

14. 把 5.7 节例 （ a ) 中的切比雪夫不等式的变形推广到鞅上 .® 


① A. W. Marshall, A one-sided analog of Kolmogorov' a inequality, Ann. Math. Statist., vol. 
31(1960) pp. 483-487. 



第 8 章基本极限定理 

本章的主要结果出现在 8.1 节、 8.3 节和 8.6 节中 . 8.4 节、 8.5 节和 8.7 节可以 
看作是有趣例子的源泉.之所以选择这些例子，是由于它们在其他章节中具有重要 
性. 

最后两节是用来讨论在卡拉马塔意义下的正则变化函数的.这一有趣的理论逐 
渐地显示了其重要性，但是在教科书中是找不到的，而且也不适合于对分布函数的 
讨论.利用 8.9 节的渐近关系式可以避免概率中大董无关的计算，它们所具有的技_ 
巧性与简单的 8.8 节形成对照. 

8.1 测度的收敛性 

以下的理论与维数无关.为了表达的方便，文中只就一维分布讨论，但利用 3.5 
节的约定，诸公式可以毫不改变地应用于高维中. 

两个例子是我们要讨论的现象的典型例子. 

例 （ a ) 考虑一个任意的概率分布令 

F n ( i ) = F(x - n " 1 ). 

在 F 的连续点 ® 上，我们有 F n ( x ) F (*), 但在不连续点上，咫⑻— F ( x -). U 
是，我们将仍然约定，序列 { F n } 收敛于 

例 （ b > 这次我们设 F „( x ) = F(x + n ), 其中 F 是连续分布函数.于是对于所 
有的 x , F n ( x ) -* 1,极限存在，但不是一个概率分布函数.这里对于每个有界区间 
I , F n ( I ) — 0,但当 J 为全直线时， F n (/)^»0. 

例 （ c ) 令 F n ( x ) = F(x + (- l ) n r »), 则 F an ( x ) — 1,而 F 2 n +1 ( x )-*0. 因此，像这 
样的分布函数不收敛，然而对于每个有界区间却有 F n { I ) — 0. ► 

基本概念 与记号 

有必要区别3种连续函 数类. 在一维中①， C (- oo , oo ) 是所有有界连续函数组 
成的类； C -[- oo , oo ] 是具有有穷极限 ti (- oo ) 和 u (+ oo ) 的连续函数所成的 子类； 最 

①对于*维中的类似慨念，注意在一蝤中， C[-oo,oo] 只不过是通过加 ±oo 于 R 1 得到的线上的 
连续函败类.对 R 2 中的 C[-oo,oc], 两个轴都被这样地扩大，这要求极限 u(x, ±oo) 和 u(±oo,x) 
对每个败 a: «存在.这函败类本身不是很有意思，伹是分布函败屑于它.对于 C 0 (-oo,oo), 赛求 
u(x, ±oo) = u (士 oo, z) = 0. 
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后， C 0 (- oo , oo ) 是“在无穷远处等于0»,即 u (± oo ) = 0的连续函数所成的子类. 

如果 J 是开区间且其端点不是原子，那么我们说 J 是概率分布 P 的连续区 
间 .® 把整条 直线当 作连续区间.在本节中，我们利用简略记号 

En(«) = / u(x)F n {dx}, E(u) = f «(x)F{da:}. (1.1) 

J —OO j —oo 

本节中表示正常的概率分布，但容许 F 是亏损的(即它的总质量可以< 1, 
见 5.1 节中的定义). 

定义 ® 序列 {F„} 收效于(可能是亏损的)分布 F, 如果对于 F 的苺个有界的连续区 
间/， 

^n{/} - F { I ). (1.2) 

•在这种情形下，我们记尸或 F = 

如果 F 不是亏损的，那么称收敛是正常的. 

为了叙述清晰，我们有时谈及非正常收敛，以表示极限 F 是亏损的. 

为了便于参考，我们给出2个正常收敛的简单准则. 

准则1 收敛 Fn — F 是正常的，当且仅当对于每个 e>0, 有相应的數 a 和 JV, 使 
得对于 n > JV, F„{-a,a} > 1 - e. 

证不 失一般性 ，我们可以假设^是极限 F 的连续 区间. 条件是充分的，因为 
它蕴含 F {=^ a ] > 1 _ e , 因而 F 不能是亏 损的. 反之，如果 F 是概率分布，那么 
我们可以选择这样大的 a , 使从而对于充分大的 n , 

F n {- a , a } > 1 - e , 


因而条件是必 要的. ► 

准则2 为使概芈分布序列 { F „} 收敛于正常概率分布当且仅当对于 F 的每 
个连续区间（有界或无界 )7, (1.2) 成立 • 

(这组含，在正常收敛的情况下， F n (x) F(:c) 在 F 的每个连续点上成立 •） 

证我们可以假设其中 F 可能是亏损的.显然，为使 F 是正常的，当且 
仅当 (1.2) 对于 J = ^55^5 成立，因此准则的条件是充分的.其次假设 F 是正常的 
概率分布.对于 0 ： > -(*，区间 - 00,1 是 - 00,0 与0的 并集. 因此，利用上一准 

①在高维中要求/的边界有撅率 0. 

® 对于对 一般测 度论感兴趣的读者.我们陈述如下内容.只要把•连续区间 • 换为•边界测度为零的 
开集 - ,本节的定义和定理对于任*局部*空间中的有界测度也适用而无任何改变.有界区间对应 
于絷集合的子集.最后， Co 是在无穷远处为零的连续函数类.即 U e Cb, 当且仅当 I* 是连续的， 
且在某个 JS 集合外有 |i«| < 8. 其他的函数类在本节中不起作用. 
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则可以看出，对于充分大的 a 和 n , {- oo ,4 与 F{-oo,x} 之差小于 3 e . 类似的 
论证适用于5^3,因此 (1.2) 对于所有的半无穷区间都成立. ► 

我们用 (1.2) 定义了收敛性，但下一定理说明，我们也可利用 （1.3) 作为定义关 
系式. 

定理1⑴ — F , 当且仅当① 

对于所有 u € Co (- oo , oo ), 有 E n ( u ) —* E («). (1-3) 

( ii ) 如果收敛是正常的，那么对于所有的有界连渎*數， 


E„(«) -► E («). 

证 ( a ) 从关于正常收敛性的断言开始是方便的.假设 F 是概率分布，凡 —_ F . 令 
u 是一连续函数，使得对于所有的 i ,| ti ( a :)| < M .令 A 是 F 如此之大的连续区间， 
使得 F{A] >l-e. 于是对于余集当所有的 n 充分大时， F „{^} < 2e. 

因为 u 在有限区间中是一致连续的，所以可以把>1分成这样小的区间 
使得在每个区间内， u 的波动小于 e . 这些区间 A 可以选为尸的连续区间.在4 
内，我们可以用阶梯函数 a 来逼近 U , 这个在每个4中取常数值，并且对于 
所有的 I € ^,|«(®)- or (*)| < e . 在余集 A 中，我们设⑻= 0. 于是对于 
x e A', | tt ( x ) - ff (®)| < M ，且 

| E («) - E ⑷ I 彡 eF{A) + MF{A '} 《 e + Me . (1.4) 

类似地，对于充分大的 n , 

| E „( t *) - En («7)| < eF n {A} + MF n {A'} 

<e + 2Me. (1.5) 

现在 E n ( a ) 是趋于 F{I k ) 的值 F n {I k } 的有穷线性组合.由此推出 E „(«7)- 
E ( a ), 因此对于充分大的 n . 


^)-^)\< 6 . ( 1 . 6 ) 

联合上面 3 个不等式，得 

|E(u) - E„(u)| ^ |E(u) - E(( t )| + |E((r) - E„(<r)| 

+ |E„(«7) - E„(u)| < 3(M + l)e. (1.7) 

①如果对于某个函败类, E„(tt)- E(u), 那么我们说•■关于这个 函败类 弱_收敢于因此在定义 
1意义下的收敛等价于关于 Go (— oo,oo) 的弱收敛. 
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由 e 之任意性，这蕴含 En ( ti ) — E ( u ). 

这个论证对非正常收敛的情形就失效了，因为这时 F „{ A } 未必很小.但是在 
这种情形下，我们仅考虑函数 u € C 0 (- oo , oo ), 且区间4可以选得很大，使得对于 
xgA 1 , |u(i)| < e. 于是对所有的 a：， \ u ( x ) - «r(a:)| < e, 不等式 (1.4) - (1.5) 以右端换 
为 e 的更强的形式成立.因此， (1-2) 蕴含 (1.3). 

( b ) 我们来证明① E „( U ) - E («) 蕴含凡 — F •令/是长度为 L 的 F 之连续 
区间.用表示具有长度 i + 5的同心区间，其中 <5选得足够小，使得 F { I S } < 
+ e . 令 u 是一连续函数，它在/内取常数值1,在/«外取0,且处处有 
0 < u ( x ) < 1. 于是 


E „(«) > F n {/}, E ( u )< F { I S ) < F {/} + e . 
而对充分大的我们有 

E „( u ) < E ( u ) < E ( u ) + e , 


因此 

F„{/} < E„(u)< E(u) + e< F { I t } + e < F { I } + 2 e . 

把 /« 换为长度为 <5 的区间，利用类似论证，我们得到反向不等式 F n { I ) > 
F {/} - 2 e , 从而 F „ — F , 如所 欲证. ► 

我们希望有一个不必先知道其极限的性质的收敛准则.这由下列定理给出. 
定理 2 为使概率分布序列 {F„} 收敘于一个（可能是亏损的）极限分布，当且仅 

当对于每个 ueC7 0 (-oo,oo), 期望值序列 {E„(u)} 收敛于有穷极限. 

证®必要性包含在定理1中.为了证明充分性，我们提前使用 8.6 节的选择定理 
1.( 它是基本的，但是最好把它和有关的论题一起讨论 .） 

按照这个定理，总可以选择•个子列 { F „ r } 收敛 T -个有可能是亏损的极限 
少.用 E *( u ) 表示 u 关于#的 期望. 令 u G C 0 (- oo , oo ). 于是根据定理1, EWOi )— 
E *( u ). 但也有 E n * ⑻— limE „( n ). 从而 E *( u ) = limE „( u),u 在 Co {- oo , oo ) 中是 
任意的.再次应用定理1可得 — 武此即所欲证. ► 

例 （ d ) 矩的收敛性. 如果分布 F „ 集中于5^上 ，那么 u 在这个区间外的定义是 
不重 要的. 在定理中，只需假设《在5^上连续就够了.每个这样的函数可以用多 
项式一致地逼近（见 7.2 节). 因此，定理可以重新叙述如下. 集中在 5^ 上的 分布仏 
①应用定理2的证明是比较简单的，但是这里的证明更为宣观. 

® 如果利用里斯表示定理 (5.1 节中的注那么此定理是显然的.实际上， lunBnfu) 定义了一个线 



8.1 測度的收敛性 221 


的序列收敛于极限当且仅当对每个 fc , 矩 E „( X fc ) 的序列收敛于一个数 u fc •在 
这种情形下，= E ( X fc ) 是 F 的阶矩，且因为 W = 1,所以收敛是正常的•(见 
7.3 节 •） 

例 （ e ) 矩的收敛性（续) • 一般说来，即使正常收敛于 F , F „ 的期望也未必是 
收敛的.例如，如果对 n 2 賦以质量 n - 1 , 对原点 W 以质量1 - n - 1 , 那么 { F n } 
收敛于集中在原点上的分布，但是 E „( X ) — oo _ 然而我们有下列有用的准 则：如 
果且对于某个 p > 0,各个期望 E „(| XK ) 有界， 那么 F 是正常概牟分 

布.实际上 / | x | p F n { dx } > a p (l - F „{- o , o }), 只有当 1 - F {- o , o } < a~»M 
J \ x\^a _ 

时才有 a〃(l - F „{- a , o }) < M •由于 a 可以选取任意大，所以尸必是正常的•稍微 
加强这个论证，就可证明阶数 a < p 的绝对矩 E „(| A - r ) 收敛于 E (| X |«). 

例 （ f ) 密度的收敛性.如果概率分布 A 有密度/„,那么即使& - F 且 F 有连续 
密度， / n 也未必收敛.作为例子，对于0 < a: < 1,令 /„(i) = 1-C06 2 nnx ； 对于 re 的 
其他值，令 /„(*) = 0. 此处收敛于均匀分布，具有分布密度 / Oc ) = 1,0<*<1, 
但 /„ 不收敛于 /• 另一方面，如果/„ — /且/是概牟密度，那么 F „ - F , 其中 F 
是具有密度/的正常分布.实际上，法图引理 [4.2 节 (2.9)] 蘊含，对于毎个连续区 
间八 

Um inf F n {7} F { I }. 

如果对干某个 J 不等号成立，那么它对每个较大的区间，特别是对=35^5也成立. 
这是不可能的，因此 （1.2) 成立. ► 

在讨论诸如 sin ta 或 v(t + x ) 这样的依赖于一个参数 t 的函数时，知道对 
于充分大的关系式田„(叫） _ E ( u «)| < e 对所有的*同时成立，常常是有用的. 
我们来证明，如果函数叫构成的族是等度连续的，即如果对于毎个 e > 0,存在一 
个与 t 无关的使得当 Isa - xi \<8 H | ut ( za ) -< e . 那么上述情况确实 
成立. 

系俽设 F „ — F (正常收敘).令 { u *} 是依賴于参数*的等度连续函數族，且使得 
对于某个 M 和所有的 | u t | < M < oo •于是关于 t 一致地有 E „( ut ) -4 E ( ttt ). 

证定理2中 E n ( u ) - E («) 的证明依赖于把区间4划分成小区间，在每个小区 
间中 u 的变化小于 e . 在现在的情况下，这种划分的选择与 t 无关，从而断言就是 
显然的了. ► 

例 （ g ) 令 Mx ) = n { tx ), 其中 u 是满足 lii ^ x )! < 1的可撤函数.根据中值定理， 

| ut ( l 2 ) - tit ( xi )| < | t || l 2 - III . 

因此，只要把*局限在有限区间 W 上，函数族就是等度连续的.因此，在每个有 
限 t 区间上，一致地有 E n ( tit ) - E ( tit ). ► 
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8.2 特殊性质 

按照 5.2 节的定义1,两个分布1/和 K 是同类型的，如果它们只是位置参数 
和尺度参数有所不同，即如果 

V(x) = U(Ax + B), A> 0 . (2.1) 

我们现在来证明，在位置参数的改变不影响极限分布类型的意义上，收敛性是一种 
类型性质.正是这个亊实，使得不指定适当的参数而说“渐近正态序列”成为合理 
的.更明确地，我们证明 

引理1 令£/和 K 是两个都不集中于一点上的概牟分布.如果对于概年分布序列 
{ F „}, 常數％ > 0及 o „ > 0,在所有连埃点上， 

Fn{OnX + bn)-* U(x), F n (a n x + 0 n) ^(*), (2.2) 

那么 

—A > 0, H — B , (2.3) 

On On 

并且 （2.1) 成立.反之，如果 （2.3) 成立，那么 （2.2) 中的两个关系式是等价的，且都 
&含 (2.1). 

证由于对称性，我们可以假设 (2.2) 中第一个关系式成立.为了简化记号，我们 
令 G „( i ) = F n (a n x + bn)，Pn = an/an,<T n = (/3„ - b n )/a n , 其次设 G n -♦ 如果 

Pn A, <r„ -* B, (2.4) 


那么显然 

G n {p n x + < r „) -» V (®), (2.5) 

其中 V[x) = U(Ax + B). 我们来证明，只有当 (2.4) 成立时， (2.5) 才可能成立 • 

因为 V 不集中在一点上，所以至少存在两个值; r ' 和 a :", 使序列 {p n x' + a n } 
和 {pn^ + an} 保持 有界. 这蕴含序列 { p „} 和 { a n } 的有界性，因此可以找到这样 
的整数叫的序列，使如 — 欠及 — B . 但是，还有 WaO = U(Ax + B ), 因此 
>1 > 0,因为否则 V 就不是概率 分布. 由此推出，极限 A 和 S 对所有的子序列是 
相同的，因此 （2.4) 是正确的. ► 

例如果 V 集中于一点上，那么引理就失效了.因此， 如果如 oo 和％ = (-1)", 
那么条件 (2.4) 不满足，但 (2.5) 对于集中于原点上的 V 是成 立的. ► 

两种类型的概率分布序列 { F „} 是如此经常地出现，以致于应当给它们各自起 
一个 名称. 为记号明晰计，我们在形式上以随机变量来陈述定义，但是概念实 
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际上只涉及它们的分布凡.因此，在不引用任何概率空间的情况下，定义是有意 
义的. 

定义 1 如果对于任一 e > 0, 


P {| J ：„|> e }^0, (2.6) 

那么称依概率趋于0,我们用 X „' 0 表示. 

与有相同的意义. 

注意，为使 (2.6) 成立，当且仅当分布 F„ 趋于集中在原点上的分布.但是，一 
般说来， Fn ^ F 不蕴含关于 X lt X 2 , - 的收敛性的任何结论.例如，如果勾是具 
有共同分布 F 的独立随机变董，那么 F„ — 但是序列 { X n } 不依概率收敛.下 
列简单引理经常用到，但不总是明显地指出来•(例如，在第1卷第10章中所用的 
截尾 方法，实际上依赖于下列引理 •） 

引理2 用表示义„和匕的分布.俽设 

Un^O， G n -* G . 


那么也有 —» G . 

特别地，如果，则其中 F 是X的分布. 

证如果彡: C, 那么 y „ < z + e , 或者 X n - y n <- e . 后一事 件的概率趋于 0 , 
因 此对于所有充分大的 r», F„(a：KG n (x + e) + e. 同样的论证导致相反方 向的类 
似不等式. ► 

定义 2 如果对于每个 e >0, 存在一个 a , 使得对于所有充分大的 n , 有 

P {| X „| > a } < e , (2.7) 


那么称序列 { X „} 是随机有界的. 

这个概念同样适用于高维空间中的分布和随机向量 X„. 

正常收敛序列显然是随机有界的，而非正常收敛排除了随机有界性.因此，我 
们有一个平凡但有用的 准则： 如果 分布八 收敛， 那么极限 F 是正常分布，当且 
仅当 {F„} 是随机有界的 _如果 { X „} 和 { Y n } 是随机有界的，那么 {X„ + K„} 也 
是随机有 界的. 实际上，只有当 |X„| > a 与 |y„| > a 二者中有一发生时，事件 
|1„ + 1^>2( 1 才 有可能发生，因此 

P {| X „ + y „|>2 a }^ P {\ X n \ > a } + P {| y n | > a }. (2.8) 
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8.3 作为算子的分布 


点函数 u 和概率分布 P 的卷积卩=在 5.4 节中已定义.如果我们用 
««(x) = u(t-x) 定义一个函数族 { u t }, 那么可把值 U ( t ) 表示为期望 

U ( t ) = J u(t - y)F{dj/} = E(ut). (3.1) 

我们由它来推导一个正常收敛 准则. 它是以具有极限 u(±oo) 的连续函数类 
C [- oo,ool 为基础的，因为这样的函数是一致连续的. 

定理1 为使概芈分布的序列正常收敛于一概芈分布 F , 当且仅当对于每个 
«€ C[-oo,oo], 卷枳 U n = F„iru 一致收敛于一极隊 [/• 在这种情礼下 ， = F - ku . 
证条件是必要的，因为 U 的一致连续性蕴含函数族 {u t } 等度连续性，因而根据 
上面的系，一致地有 U n - F - ku . 反之，定理的条件保证了期望 E„(u) 的收敛.我 
们在第1节中巳看到，这蕴含 F„ — F, 但还需证明 F 是正 常的. 为此，我们利用 
第1节的准则 1. 

如果 u 从0单调增加到1，那么每个也从0单调增加到1•由一致收敛性，存 
在这样的使得对 n>N 及所有的 z, 队 ⑷ - U N ( x )\ < e •选取 a 为这样大，使 
得 U N {- a ) < e . U N 由形如 (3.1) 的卷积所 确定； 把积分区间限制于 _oo < y < -2a, 
我们看到，对于 n > N , 


2 e > U n (- a ) > «(a)F„(-2a). 

因为 《 增加到 1, 所以对于充分大的 ri 和 a, F„(-a) 要多小有 多小. 由于对称性， 
同样的论证适用于1 -_F( a ), 因此由准则1知 F 是正 常的. ► 

为了说明最后这个结果的威力，我们来推导一个重要的分析定理，它的证明在 
现在的概率背景下变得特别简单 .( 关于典型的应用，见习题 10.) 

例 （a) —般逼近 定理. 对于任一概串分布 G, 我们有一分布族 { G h }, 其中 G h 与 G 
只是尺度参数有所不同： G h ( x ) = G ( x / h ). 当/» — 0时，分布 G h 趋于集中在原点上 
的分布，因此根据上一定理，对于每个《 e C7[—oo,oo]，Gfc1kru-+1*, 收敛是一致的①. 

①为了直接 轮证， 注意 

G n *u(t) _ u(t) = J [u(t — y) - u(t)]G{dy/h}. 

对于给定的 e > 0, 存在这样的 （5, 使得在每个长度为 24 的区间内， u 的波动小于 e. 于是 
-的- u(t)1G{dw/h} < e ，因为 G h 赋予 1»1 > « —个当 h-*0 时趋于琴的质童，所 
以 

[ W* -y)~ v(t)]G{dy/h} -* 0. 




如果 G 有密度 S , 那么 G h - ku 的值为 
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G h -ku(t) = J u(y)g \^V- ( 3 . 2 ) 

当 9 有有界导数时，这对 G h 也是正确的， (3.2) 可在积分号下取微分.取 g 为正态 
密度，我们 得到： ► 

通 近定理 对于每个 u e CI-oo.oo], 存在无穷可微的 v e C[-oo,oo], 使得对于所 
有的； c, |u(a:) - 1 >(®)| < e. ► 

在本节中，把笨拙的卷积符号★换成一个比较简单的记号是合乎需要的，这 
个记号强调在 (3.1) 中分布 F 是作为把 u 变成 t/ 的算子的.这个箅子以徳文字母 
S 表示，我们约定， U = du 即表示 f； = F-ku. 只有当它与其他类型的算子 同时出 
现时，才可以看出这种表面上的故作玄虚的真正优点，于是很容易看清楚，分布是 
起着它原先的概率作用，还是只作为一个分析算子出现（即使这种细微的区分也可 
以在分布本身中间导致纷乱).由于这个解释，我们引入> 

记号的约定 对每一镟牟分布 _F, 我们把它与一个从 C7[-oo,oo] fl 自身的算子 
对应起来，这个算子把函數 u 变成 Su = F-ku. 分布及相应的算子尽可能用相应的 
拉丁字母和德文字母表示. 

照例，在算子记号中，；表示 S 对 (Eu 进行运算的结果，因此表示与两 
个概率分布的卷积对应的算子.特别地， 5" 是与 F ^*( F 与本身的重卷积） 
对应的算子. 

例 （b) 如果札表示集中于 a 上的原子型分布，那么^是平移算子= 
u(a - x ). 特别地， flo 是恒等算子 I ftotx = u. 

我们现在把有界函数《的范数 || « || 定义为 


II « 11= sup|u(x)|. (3.3) 

利用这个记号，陈 述“％ —致地收敛于可简化为 || 0„-«||-0.注意，范数满 
足容易证明的 三角形不等式 || U + «||<|| II || + || V II. 

一个算子 r 称为有界的，如果存在一个常数 a, 使得II a. II u II. 具有这 
个性质的最小的数称为 r 的范数，记为 II r II. 利用这些记号，与分布函数对应的 
线性算子的主要性质是： 

它们是正的，即 u 多0蕴含> o. 它们有范数1,这蕴含 

II ||<|| u || . (3.4) 

最后，它们是可交换的，即 5<E = C5. 
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定义 ® 如果 S n 和5是分别与分 布禹數 扣 F 对应的算子，那么当且仅当对于 
每个 u e C [— oo , oo ], 

||5 nU - ffu ||-»0 (3.5) 

时，我们记 — s . 

换句话说，如果一致地有 F n - ku ^ Firn , 那么 — S . 定理1现在可以重新 
叙述如下. 

定理 la F „ 正常收效于 F , 当且仅当 

下列引 理是基本的.它具有代数不等式的形式，并说明了新记号的富有启发性 
的威力. 

引理1 对于与概牟分布对应的算子， 

II » i ? a « - eie . H <|| - €,« || +1| s 2 u - e 2 u ||. (3.6) 

证左端的算子等于 - «£ i )5 2 + (ffa -吃瓜， (3.6) 可由三角形不等式与而和 
€ i 的范数< 1这个事实推出.注意，这个证明也适用于亏损概率分布. ► 

(3.6) 的直接推论是： 

定理2 设概牟分布序列 { F „} 和 { C ? n } 分别正常收敛于 F 和 G , 則 

F „* G „ — FirG . (3.7) 

(根据 F - kG 的定义，收敛是正常的.如果 F 或 G 是亏损的，那么定理不成立•见 
习题 9.) 

作为第2个应用，我们来证明，如果把函数 u 的类限制到具有各阶导数的较 
好的函数所成的类上，定理1仍然成立.这样我们就得到更灵 活的： 

准则1设是概芈分布.如果对于每个无穷可微的® w € C [- oo , oo ], 序列 {?„«} 
一致收敛，那么存在一个这样的正常概牟分布使得 — F . 

证在例⑷中巳证明，对给定的 u € C [- oo , 00 】和 e > 0,存在一个无穷可微的 t ; 
使得 || u - v ||< G 根据三角形不等式， 

II Snu - IKII || + || _ SmV || + || ^ m V - ff m U || . (3.8) 

右端第 1 项和最后一项都 < 6 根据假设，对充分大的 n , m , 中间项< e . 于是 
{5 n «} 一致收敛，根据定理1， — F . ► 


①利用巴拿# ( Banach ) 空间的术语> (3.5) 称为强收 敢性.注意. 它并不9[含 || ff „ _ ff || - 0.例 
如，如果集中于 1 /n 上， ff 是恒等算子，薄么 ff „ u ( x ) - ffu (*) = u (* - n - 1 )- u (*), (3.5) 
成立，但 || ff n - ffll = 2. 因为存在由数 | t <| < 1,使 u (0) = l , v (- n -») = - l . 

® 这表示任意阶的导败存在且属于 Ct-oo,ool. 
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利用在 (1.1) 中定义的 E „ 和 E , 同样的论证可 得出： 

准则2 设凡和 F 是正常概牟分布，如果对于每个在无穷远处等于0的无穷可 
撖函数 t ;, E „ ⑻- E ( v ), 那么 F „ — F . 

根据归纳法，基本不等式 （3.6) 可推广到具有多于2项的卷积 上去； 为了引用 
容易，我们把明显的结果写成： 

引理2 设 9 J = 0 i -0„, 其中石和 巧 与概牟分布对应，那么 

II U «-®«| K ^||5 iU -0 jU II ， (3.9) 

i=i 

特别地， 

||5" u -®" u ||< n _ || Su -0 u || . (3.10) 

(关于应用，见习题14和习题 15.) 

8.4 中心极限定理 


中心极限定理建立了使独立随机变量之和是渐近正态分布的条件.它的作用 
和意义巳在第1卷 UU 节中部分地得到说明，并且我们巳在一些场合应用过它 I 最 
后是在 6.11 节例 （ g ) 中].它在概率论中占有很高的地位，这个地位是由于它的悠久 
历史，以及它在理论发展过程中起过的和在应用中还在起着的窗有成果的作用而 
取得的.因此，可以利用中心极限定理作为比较我们所采用的各种方法之范围的实 
例.为此，我们将给出几种证明，更系统的讨论（包括充分必要条件）将在第9、15 
和16章中看到.目前的讨论使我们离开了主题，它的目的是以一个惊人的和重要 
的例子来说明算子术语的优点.此外，许多读者将希望对最简单的背景下的中心极 
限定理给出一个容易理解的证明.不惜有一些重复，我们从一个特殊情形开始 • 
定理1 ( R 1 中的同分布情形 •） 设…是具有共同分布 F 的独立随机 变量. 


伋设 



E ( X fc ) = 0, 

Var ( X fc ) = 1. 

(4.1) 

当 n — » oo 时，正规化和 



S ： = (Xi + 

•• + X n )/^n 

(4.2) 


的分布赵于具有密度 n ( i )= e - i * a / V 2 n 的正态分布叽 
用纯分析的术语来说，对于期望为0、方差为1的分布 


^{ xy / n ) m ( x ). 


(4.3) 
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为了证明，我们需要如下的： 

引理如果 Sr •是与 F n ( x ) = F(Xy/fi) 对应的算子，郢么对于每个具有三阶有界导 
数的 u e C * l — oo , ooj , 在直钱上一致地有 

n [5 n « - u 】-♦ iu M . (4.4) 

证因为 E ( X 2) = 1, 所以我们可以由下式定义一个正常概率分布 

Fni^y] = = ny 2 F{y/ndy}. (4.5) 

变量代换 v % = «表明矽趋于集中在原点上的分布•由 （4.1) ,关于 (4.4) 中两 
边之差，我们有 

n[5 n u(*) - «(®)] - ^u ，# (*) 

_£~| !!fe -rt z ^) ±jg M_ i„„ w ] F « w . (4 . 6) 

分子的泰勒展开式说明，对于|1/|<£,被积函数由 

>|. |K"||<e |K" || 

所 控制； 对于所有的被积函数由 || ii " || 所控制.因为吋趋于集中在原点旁的 
分布，所以对于充分大的 n , 这个量的绝对值小于 e (|| tx " || + || «'" ||),因此左端一 
致趋于 0. ► 

定理1的证明以0和分别表示与正态分布饥 ㈤ 和 9 l ( xv ^) 对应的算子•于 
是根据基本不等式 (3.10), 

^ n || Sntl - ©nU ||< n || SnU - u || +n || ®„u - u || . (4.7) 

按照上一引理，右边趋于0,从而根据 8.3 节的准则1, 5^-0. ► 

例 （ a ) 具有无穷才差的中心极限 定理. 只要选择适当的正规化常数，定理1的 
证明也完全适用于某些不存在方差的分布，注意到这一事实具有方法论的意义.例 
如， 如果心 具有这样的密度/,当|*| > 1时，/ ㈤ = 2| i |- 3 In | x |, 当 | i | < 1 
时，/ ㈤ = 0,那么 （& + • • • + X „)/(^ lnn ) 有正态极限分布.（证明只需作明显 
的改变 .） 关于正态极限的充要条件将在 9.7 节及 17.5 节中给出. ► 

这种证明方法具有广泛的应用 范围. 习题16可作为很好的练习.此处我们利 
用这个方法在更一般的背景下证明中心极限定理.下列定理在形式上是对二维空 
间叙述的，但在 If 中也成立. 
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定理2 (多元的情形).设 { Jf n } 表示具有共同分布尸的相互独立二維随机变量序 
列. 设期望为0,协方差矩阵为 


Ol 


)' 


(4.8) 


当71 4 00时，（义^+…+义)/^的分布超于具有期望为 0, 协方差矩阵为 C 的 
二元正态分布. 

证如果使用 3 .5节中的矩阵记号，那么证明不需要本质上的改变.因为下标巳经 
太累赘了，所以我们以行向量 a ： = ( a : ⑴ , a : (2) ) 表示平面上的点.于是 ri ( a ;) 表示二元 
函数，我们以下标表示它的偏 导数. 因此 ，V = ( Ul , ua ) 是一个行向量， u " = ( u jh ) 
是一个对称的 2 x 2 矩阵. 利用这个记号，泰勒展开式为 

«(* ~ y ) = «(*) - yu '( x ) + ^ yu "{ x ) y r + •••, (4.9) 


其中2/ 1 ■是 J / 的转置，即含有分量1/⑴,1/⑺的列向撤•与 (4.5) 类似，我们由下式定 
义一个正常概率 分布： 

F n { dy } = n 9( y ) P {\/^}， 其中 2 q { y ) = ^ 

如同上面的证明那样 ， 趋于集中在原点上的概率分布 .(4.6) 对应于恒等式 


n[5n«(*) - u(i)] - -m(i) 
r «( a ； - y )- u ( x ) + yu '( x ) - iyu ;, ( a :) j/ T 

Jto Q ( y ) 


F *{ dy }, 


其中 ® 


(4.10) 


m(z) = E(yu"(x)y r ) 

=uh(x)<t? + 2u 12 (i)p«T l p2 + u 22 (x)of. (4.11) 

(此处 E 表示关于 F 的期望 _) 由 (4.9), 被积函数趋于 0. 如同上一引理中那样，可 
以看出一致地有 n[»„u - u] — m, 定理的证明不需要改变_ ► 

例 （b) d 维中的随机游动 .设 XuXn , …是具有如下所述共同分布的独立随机向 
量 .X* 具有在 1.10 节的意义下的随机方向，长度 L 是满足 E(L 2 ) = 1的随机变量. 

①显然， m(i) 是乘积 <7u" 的迹（对角线元索之 和). 这在任意维空间中都是正碥的.【在一# 
中， m(x)=-^a 2 u"(x).\ 
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由于对称性，协方差矩阵 C 是具有元素$ = 1/ d 的对角矩阵.正规化和的 
分布趋于协方差矩阵为 C 的正态分布.因此，向量 S „/ v/S 的长度平方的分布趋于 
独立正态变童平方和的分布•在 2.3 节中曾证明，这个极限有密度 

«» d ( r ) =—— ' e - WV - 1 . (4.12) 

2卜, 

这个结果说明了维数的影响，特别可应用于随机飞行的 1.10 节例 （ e ). 

例 （ c ) 总体的随机扩展.作为上例的经验应用，考虑橡树总体在史前时期的扩展. 
如果新树仅是由于成熟的树落下的种子产生的，那么树苗应当位于成熟的树旁，第 
n 代的树与其祖先的距离将是渐近正态分布的.在这些条件下，一顆橡树的后裔所 
覆盖的面积大体上与树的年龄成正比.观察表明，实际的发展是与这个假设不符合 
的. 生物学家们断言，实际的扩展受到把种子带到远处的鸟的强烈影响 .® ► 

我们着手把定理1推广到不同分布的 情形. 条件给人们这样的印象，即它们是 
为了使同样的证明仍然有效这一唯一目的而人为地引进的.实际上，这些条件也是 
使具有 (4.17) 中所用的古典正规化的中心极限定理成立的必要条件.（见 15.6 节 •） 
定理3 (林德伯格 （ Lindeberg ))® •设 Xi , X 2 , ■■-是具有分布 朽， F 2 , …的相互独立 
一维随机变量，且 



E ( X fc ) = 0, Var(XX 

(4.13) 

并令 

*m = «^l ++ - 

(4.14) 

伋设对于每个 t >0. 


•广 ‘他卜 0 ’ 

(4.15) 

或等价地 


f I^Fkidy} -* 1. 

fc = i 

(4.16) 

那么正规化和 


S: = (Xi + ••• + X n )/s n 

(4.17) 


① J. G. Skellam, Biometrika , vol. 38(1951) pp. 196-218. 

® J W. Undeberg, Math . Zeit , vol. 15(1922) pp. 211-236. 特殊情形及变形以前巳知道了，但 
是 Lindeberg 给出了包含定理1的第一般形式.费勒在同一期刊， vol. 40(X953) 证明了具有 
古典正嫌化的林德伯格条件的必要性（见 15.6 节). 

林德伯格的方法很复杂，实际上可以用 P. 列#发展起来的特征函数方法来代#.在 H. F. 
Trotter, Archiv . der Mathematik , vol. 9(1965) pp. 226-234 中证明了，利用现代的方法，可以 
用简单直观的方式给出林*伯格方法.本节的证明利用了特罗特 （TVotter) 的想法. 
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的分布赵于具有期望0、方差1的正态分布饥. 

林德伯格条件 (4.15) 保证各个方差4在如下所述的意义上比它们的和# 小： 
对于给定的 e > 0和所有充分大的 

Ok < e 8 n , fe = 1, •••,«. (4.18) 

事实上，显然小于 t 2 加上 (4.15) 的左边.取 * = fe , 我们看出， (4.15) 组含 

(4.18) . 

定理3可以用定理2所指出的方法推广到高维中去.见习题17 〜 习题 20. 

证对于每个分布巧，我们可以作一个期望为0且与凡有相同方差4的正态分 
布 Gk 与之对应，于是 X k / s n 的分布 F k ( xa n ) 依赖于 fc 和 n . 我们用石,„表示其 
对应的算子.类似地， ®*.„ 与正态分布 G k ( xa n ) 对应.根据 (3.9), 只需证明，对于 
每个具有3阶有界导数的 1 * € C [- oo , oo ], 

V II Sk , n » - ®*， n U |卜 0. (4.19) 

fc=l 

我们如同定理 1 那样进行，不过现在把 (4.6) 换成 n 个关系式 

dk,nU(x) - «(l) - 嘉《〃 ㈤ 

= /: n :—' (3：) - 卜 "(x)] . y 2 F fc{8n dy}. (4.20) 

把积分区间分为 M 彡 e 和 M > e, 利用像在 (4.6) 那样的估计，我们得到 

| 卜 《 备 "|卜 MI ^ + IKII - j M < t y 2 F k { s n dy }. (4.21) 
林徳伯格条件（4.15)(令 t = 现在保证，对于充分大的 n , 

E | 卜. " u 兹叫卜 (4-22) 

对于正态分布 G *， 林徳伯格条件 (4.15) 作为 (4.18) 的简单推论是满足的，因此当 
把换成 ®*,„ 时，不等式 (4.22) 仍然成立.把这两个不等式相加，我们得到 

(4.19) , 这就完成了 证明. ► 

例⑷均勾分布.令心在 -似与 a* 之间是均匀分布的[具有密度1/(2办)1•于 
是4 容易看出，如果 a * 有界且 a ? + • ■ • + < 一 oo , 那么定理的条件是满 

足的. 实际上，在这种情形下，对于所有充分大的 n , 和式 (4.15) 恒等于 0. 另一方 
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面，如果 Eag < oo , 那么 s „ 有界， (4.15) 不能 成立： 在这种情形下，中心极限定理 
不适用•(然而，我们得到将在 8.5 节中研究的无穷卷积的一个例子 .） 

中心极限定理不成立的一个不太明显的情形是4 = 2*. 于是3# = 2»+!-2< 
2^,显然如果 t < 那么 (4.15) & m >\- 这些例子说明， (4.15) 用来保证各 
个 是渐近可忽 略的： 任一项 X k 与 S n 同阶的概率应当趋于 0. 

例 （ e ) 有界变量.假设 X * 是一致有界的，即所有的分布 F * 都集中在某一有限 
区间=5^ 上. 于是，当且仅当 知— oo 时，林德伯格条件 (4.15) 满足 • 

例 （0 令 F 是期望为0、方差为1的概率 分布. 选择一个正数〜的序列，并令 
■ F n (®) = • FX */%) (从而八有方差 4). 林德伯格条件满足，当且仅当 S n -» 00, 且 
( Tn/Sn -* 0. 实际上，我们知道，这些条件是必 要的. 另一方面， (4.15) 的左边化为 

dW ^ F {4 r }. 

k=l J \:\< ta n / o k 

在所述条件下， s n / cr k 对= 1,…, n —致地趋于 oo ,因此对于充分大的 n ， 和中 
出现的所有积分将< e . 这表示和< e #， 因此 (4.15) 是正 确的. ► 

注意到以下内容是有方法论意义的：同样的证明方法即使对某些期望不存在 
的随机变撤序列也适用，但是正规化因子当然是不同的.我们将在 15.6 节中回到这 
个 问题. 在那里，我们将更进一步分析林德伯格条件的本质 .( 见习题19和习题 20.) 

我们用关于随机和的中心极限定理一种形式来结束这个研究，其想法如下.如 
果在定理1中我们把固定的项数 n 换成期望为 n 的泊松变童 TV , 那么知的分布 
似乎仍应趋于沉在物理学和统计学中，当观察的次数不是事先固定的时候，就会 
出现类似的情况. 

我们只考虑形如知 = Xi + • • • + 的和，其中七和 AT 是相互独立的随机 
变童.我们假设有共同分布且期望为0,方差为1•利用 8.2 节的记号，我 
们有， 

定理 4® (随机和).设 N u N a , ■■- 是正整数值随机 变量， 使得 


n _1 iV n -^ l . (4.23) 


①关于向相依 的推广，见 P. BillingBley, Limit theorems for randomly selected partial aums, 
Ann. Math. Statist., vol. 33(1963) pp. 85-92. 在去焯 (4.23) 的时候，我们得■具有 
新形式的极限定理.见 H. E. Robbins, The asymptotic distribution of the sum of a random 
number of random variables, Bull. Amer. Math. Soc., vol. 54(1948) pp. 1151-1161. 

对于中心极限定理向其他类型的相依变置的推广，读者可参考洛埃韦 (Loiwe) 的书.(对于可交 
换变量，见习應 21.) 
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于是 S Nn / y/ii 的分 布超于 

—个有趣的特点是 Ss n / y / H 未被正规化为方差为1的随机变量.事实上，这 
个定理适用于 E ( jV n ) = oo 的情形，甚至也适用于期望存在的情形， (4.23) 不遣含 
rT 1 E ( A 「„) — 1. 正规化为方差为1的随机变量也许是不可能的，在这种正规化是 
可能的时候，它使证明变复杂了. 

证为了避免二重下标，我们记 P { N „ = k } = a k , 并理解为依赖于 n •与知„ 
对应的算子由形式上的幂级数给出.如同定理1的证明中那样，令^是 
与 F { Xy / n ) 对应的 算子. 因为 — 91 ，所以只需对每个具有3阶有界导数的 
ueC [- oo , oo ], 证明一致地有 


(4.24) 

fc=i 

利用明显的因式分解和基本不等式 (3.9), 可以看出 

ll ^«- 8>|| < ||5 i , fc - n | «- o || <| fc - n |- ||?„ u -«||. (4.25) 

由 （4.23), 只要 n 充分大，满足 |fc - n | > en 的系数之和就小于 e . 对于这样的 
n ,(4.24) 左边的范数为 

<53 - ® Sti ||<2 e -|| u || + 2 e - n || ff „ u - u ||. (4.26) 

« fc=i 

在引理的证明中，我们已经看到，对于所有充分大的 n , 右边彡 2 e || U || + 3 el | tx "||, 
因此 (4.24) 一致地 成立. > 


*8.5 无穷卷积 

下列定理是由于其固有的重要性而给出的，而且因为它是我们的准则起作用 
的好例子_较强的形式可在 7.8 节、 9.9 节及 17.10 节中找到. 

我们用 X U X 3 ，■- 表示具有分布 F u F 2 , -- 的相互独立 变董: .假设 E ( Xj ) = 
0, < rl = E { Xi ) 存在 • 

定理如果 cr 2 = < oo , 那么部分和 + + 的分布① G n 超于期望为0、 

方差为 <7 2 的概牟分布 <?. 


• 本节在后面用不到. 

①在 7.8 节中曾指出， W 机变* S„ 趋于一个极限. 



234 第 8 幸基本极限定理 


证为证明正常极限 G 的存在性，只需 （8.3 节定理 1) 证明，对于无穷可微的 
«€ C[-oo,cjo], 函数 SiSi … SnU 的序列当 n — oo 时收敛就 够了. 现在对于 n>m, 
根据明显的因式分解 


||?1 - SnU-Si - M \ < || S m+x (5.1) 

因为 E ( Xfc ) = 0, 所以有恒等式 

S k n ( x ) - u ( x ) = J [ u(x - y ) - u ( ar ) + (5.2) 

按照 2 阶泰勒展开式，被积函数的绝 对值彡 || u «||- y , 从而 ||5 fc u - u ||< «^| W . 因 
此，根据基本不等式 （3.9), 董 (5.1) < (^ +1 +--- + < t 2)-| I « ，, ||, 于是存在一个正 
常分布 G , 使得 G „ — G . 因为 G „ 有方差4 + ••• + #, 所以 G 的二阶矩存在 
且< < r 2 . 按照 8.1 节例 （ e ) 中的准则，这蕴含着 G 之期望为 0. 最后， G 是 G „ 和 
X n+ i + --- + X n + k 的极限分布的卷积，因此 G 之方差不能小于 G „ 的方差.这就 
完成了证明. ► 

例 （ a ) 在 1.11 节例 （ c ) 中，在0与1之间的点的随机选择根据逐次投硬币的结果 
决定.用现在的术语来说，这意味着把均匀分布表为无穷乘积 .1.11 节例 （ d ) 说明， 
相应的偶数项的无穷卷积是奇异分布（见 17.10 节). 

例 （ b > . 设％是独立的，并且 E(y fc ) = 0, E ( V ^) = 1,于是如果 SbJ < oo , 那么 
的部分和的分布收敛•在 3.7 节讨论正态随机过程时利用了这个事实. 

例 （ c ) 在純生过租中的应用 •设忍 是具有密度 Ane - W 的正变量，于是 E ( X „) = 
>/ Var ( X n ) = A ->. 在 m = < oo 的情形，定理适用于中心化变撤 

这个结果导致了曾在第1卷的 17.3 节和 17.4 节中叙述的发散純生过程的概率解 
释•“质点”以逐次跳跃的方式移动，逗留时间 A ， X 2 , …是独立的按指数分布的变 
最.此处& =不+…+ 表示第 n 次跳跃的时刻.如果 UmE (5„) =炕 < oo , 那 
么知的分布趋于正常极限 G . 于是， G ( t ) 是在时刻 t 前将发生无穷多次跳跃的概 
率. 

例 （ d ) 对于在嗓声、占线问题等中的应用，见习® 22. ► 


8.6 选择定理 

证明数列收敛性的标准方法是，首先证明至少有一 个聚点 存在，其次证明其唯 
类似的手续适用于分布，如下厲干黑利 ( HeUy ) 的重要定理提供了聚点的类 
似物.本节 的所有 定理是与维数无关的（特殊情况曾在第1卷 11.6 节中使用过). 
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定理 1 ⑴ R r 中的每个 概率分 布序列 { F fc } 具有一个（正常或非正常的）收敛于一 
极限 F 的子序列，…. 

( ii ) 所有这样的极限是正常的，当且仅当 {_ F „} 是随机有界的（見 8.2 节定义 2). 

( iii ) F n -» F , 当且仅当每个收敛子序列的极限等于 F . 

证明基于如下 • 

引理 设 ai , a 2 ，… 是任意一个点列.每个 教值函 數序列 { u „} 包含“个在所有的 
点 a ) 上都收敛（可能超于 ±00) 的子序列 Uni ，« n a ,---- 

证我们利用 G . 康托的“对角线方法”.可以找到这样一个序列使得 
值 u Vk ( ai ) 的序列收敛.为 了避免 复杂的指标，我们令=、，因此是 
{«„} 的子序列且在特殊点勿上 收敛. 我们从这个子序列中取出另一个在点 a 2 上 
收敛的子序列 ui 2> , t 4 2) ， h 、 利用归纳法继续进行下去，我们对于每个得到了一 
个在点 a „ 上收敛且包含在前一序列中的序列现在考虑对角线序列 
除其前 n -1 项外，这个序列包含在第 n 个序列 u [ n ) , i 4 n ) , …中， 
从而它在 a „ 上 收敛. 这对毎个 n 都是正确的，因而对角线序列 { i 4, n) } 在所有的点 
ai , a 2 , …上收敛，引理得证. ► 

定理1的证明⑴选{巧}为一个处处稠密的序列，并选择一个在每个点巧上都 
收敛的子序列{凡》}•以 G ( a ,) 表示其 极限. 对于不属于集合{七}的任一点: c , 我 
们把 G ⑻定义为所有使〜> a : 的 G ( 0 j ) 之最大下界.这样定义的函数 G 由0增 
加到1,但它未必是右连续的^我们只能断言， G ( x ) 位于，极限 G ( i +) 和 G ( a :-) 之间. 
但是，在不连续点上重新定义 G , 可以得到一个在所有 k 续点上与 G —致的右连 
续函数.令 a ; 是这样的点，存在两点 OiKxKaj , 使得 

G ( aj ) — G ( ai ) < e , G ( o <) < F ( x ) < G ( o ^). (6.1) 

因为 F „ 是单调的，所以我们有 Fn ^ a *) < F „,(®) < F nk ( aj ). 令 A : -* oo , 由 (6.1) 
看出，没有序列{^„„(*)>的极限点与 F ( x ) 之差大于 e ,因此在所有连续点上 
F n h { x ) F { x ). 

( ii ) 其次我们已知道，为使收敛的分布序列是正常收敛的，当且仅当它是随机 
有界的.因此在巳知 （ i ) 的情况下，其余的断言几乎是重复的. ► 

选择定理是极其重要的.由下述数论中的著名定理可以看出它的无比威力，而 
且此定理还提醒大家注意，我们的概率术语绝不能使得发展起来的理论的更为广 
泛的范围棋糊不清. 

例⑷ 數论中的等分 布定瑾 .® 设《是一^无理数，是⑽的小数部分.以 N x ( x ) 

①此定理通常归功于外尔 （H. Weyl), 虽然由波尔 （Bohl) 和塞尔平斯基 (Sierphiski) 独立地发现•见 
G. H. Hardy and E. M. Wright, Theory of number , Oxford, 1946, pp. 378-381, 在非概車背 
聚下考虑此定理时将增加证明的困雄. 
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表示 oti , a2 ,---, a n 中《 z 的 项数. 于是对于所有的0 < a : < l , n -1 AT n ( ar ) -♦ x. 

证我们考虑在具有单位长度的圆上的分布及 函数； 换句话说，坐标的加法被模1 
所 约化. （在 2.8 节中曾说明过这个 概念. 分布函数这个方便工具在这圆上变成无意 
义的了，但在测度的意义上的分布仍有意义 .） 令&是集中于 n 个点 a ,2 a ，…， na 
上且对毎个点賦以概率1/«的原子型分布.根据选择定理，存在一个序列 m , n 2 ，…， 
使 A * — 其中 F 是正常概率分布（圆是有界的).取 F „ 与任意连续函数 u 的卷 
积，我们得到 


士 [ u ( a : — a ) + u(x - 2 a ) + ••• + u(i - n ^ a )] -+ v(x). (6.2) 

现在很明显，把 a : 换为; r - a 并不影响左边的渐近性质，因此对于所有的 x , v (*) = 
v(x - a). 这又薄含，对于 fc = 1，2,…， 《(») = w (*- fca ). 根据 5.4 节中引理2的 
系，点 a ,2 a , …是处处稠密的，因而 W = const . 于是我们证明了，对于毎个连续的 
%卷积是一个常数.由此推出， F 应对相等长度的区间賦以相同的数值，因 
此 F{I] 等于区间 J 的 长度. 其他极限的不可能表明，整个序列 { F n } 收敛于这个 
分布，这就证明了定理.我们称 F 为圆上的均勾分布. 

例 （ b ) 矩的收 敛性. 令和 F 是具有有限的各阶矩的概率分布，分别以 /4 n> 和 
Mfc 表示. 我们由 7.3 节知道，不同的分布函数可以有相同的矩序列，因此从 
的性质来推断 F n ^F 未必总是可能的.但 是如果 F 是具有矩 mi , M 2, …的难一分 
布，并且如果对于 fc = l ，2，...，/ ii n) - Mfc . 那么 匙― 尺 事实上， 8.1 节例 （ e ) 的 
结果说明 { F „} 的每个收敛子序列收敛于 F . 

例 （ c > 可 分性. 为了简洁起见，如果一个分布集中于有穷多个有理点上且对每个 
点賦以有理的质 M , 则称这个分布是有理 分布. 任一分布 F 是有理分布序列 {&} 
的极限，并且我们可以选择期望值为0的因为这可以用加上一个原子及质董 
的任意 小童的 调整来 达到. 但是只有可数多个有理分布，它们可以排列成简单的序 
列 Gi , C ?2, -- 因此存 在一个期望为 0, 方差有哏的分布序列 { G „}, 使得每个分布 
F 是某个子序列 { G „,} 的极限. ► 

定理1是以概率中最常用的形式叙述的，但做了不必要的限制.证明依赖于下 
列事实：满足 F n (-oo) = 0, F n {oo) = 1的单调函数序列 { F n } 包含一个收敛子序 
列. 当把条件 F „( oo ) = 1换成数列 { F „( i )} 对于每个固定的; c 是有界的这个较弱 
的要求时，上述结论仍成立.于是极限 F 是有穷的，但可能是无界的，其导出测度 
在区间 - oo , a ! 上是有穷的，但在 - 00 , 00 上可能是无穷的.类似的放松条件对 -oo 
也是可能的，我们导出定理1的下列推广，其中符号表示这关系式在任一 
有穷区间上成立. 

定理2 设 {/!„} 是一个測度序列，使得数列 Hn{-X,x) 对于每个 I 是有界的，則 
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存在一个測度 / i 和数列《1，《2，".，使 / Xn k 

选择定理的变形对许多函数类都成立.特别有用的是下列定理，通常称为阿斯 
科里 (AscoU) 定理或阿尔泽拉 (Arzel^) 定理. 

定理3 设 { u „} 是等度 连续* 数序列，®且 | u „| < 1,則存在一个收效于一连续极 
限 IX 的子序列 {«„„}, 且收敛在每个有琅区间上是一致的 • 

证再选择一个所有点…的稠密序列和在毎个~上收敛的子序列以 «( 0i ) 
表示极限.于是 


l«n r (*) - Un •⑻ | < l«n r (I) _ Un»| 

+ l«n.(x) - «n.(Oj)| + |«n,.(o>) - U n ,(~)|. (6.3) 

根据假设，最后一项趋于 0. 由假设的等度连续性，对于每个: T, 存在这样的点巧， 
使得对于所有的 n. 


|t*n ㈤- Wn(a,)| < e, (6.4) 

并且对任一有穷区间/,可选择有穷多个七， 记为使得对每一 x€l, 
都有一 aj „(l < k ^ m ), 使得 (6.4) 对此％ 成立.由此推出，对于所有充分大的 r 
和*, (6.3) 的右边 < 3e 在 J 上一致 成立. 因此， 《(*) = Um«„ r (x) 存在.由于 （ 6.4), 
我们有|«(*) - «(ai)| < £,这蕴含《的连续性. ► 

*8.7 马尔可夫链的遍历定理 

设X是集中于有穷或无穷区间 G 上的随机核•[根据 6.11 节中的定义1,这表 
示 K 是两个变量（即点3：和集合 r) 的函数.对于固定的 r, 它是： c 的贝尔函数； 
对于固定的 xen , 它是集中于上的概率分布 •] 在高维中，区间可以换为更 
一般的区域，理论不需作任何改变. 

在 6.11 节中曾证明，存在具有转移概率 K 的马尔可夫链 (Xo.Xj,•••). 初始变 
量 x 0 的分布70可以任意选取，于是 XuA, ••的 分布可由下式递推地给出， 

7 n(r) = ^ 7 n-l(dx)Jf(*,r). (7.1) 


①即对每个£>0,有相应的《 > 0,使得当 K - *«| < 时，对所有的 n, — u„(j： w )l < e. 

• 之所以讨论此材料，是由于它的重要性，而且可作为一个说明选择定理的应用的例子.以后没有明 
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特别地，如果 7Q 集中于点: r 0 上，那么 7n(r) = if(")(10,T ) 与 从吻到 r 的转移概 
率一致. 

定义 1 如果对于每个开区间/ C /2,«{/} >0,那么称測度 a 在中是严格正 
的.如果对于 a 中的每个 a : 和每个开区间 I , K ( x , I )>0, 那么称核尺是严格正的. 
定义 2 如果存在一个严格正的镟率分布 a , 使得7„ — a , 且这种收效与初始分 
布加无关，那么核是遍历的. 

对于 a 的每个连续区间，这等价于 

— a (/)>0. (7.2) 

这个定义同离散情形（第1卷第15章)，它的意义巳在 6.11 节的例子中得到讨论和 
阐明. 

最一般的随机核可以有种种变态，我们拟把理论局! S 于以连续方式依赖于 re 
的核，表达这个理论的最简单的方法是考虑由 K 导出的连续函数类上的变换.给 
定一个在基本区间 a 上有界且连续的函数 ti , 我们定义«0 = «,由归纳法， 

« n (*) = j n K 、 X ， 如)知-1 ⑼， (7.3) 

这个函数变换是测度变换 (7.1) 的对偶 变换. 注意， 在本节中，在这两种情况下，指 
标用来表示 A ： 导出的变换的结果. 

我们想要强 加于允 上的正则性质，粗略地说，是使叫不应比 uo 坏.下列定 
义恰好表达了我们的需要，但好像只是形式上的 • 例子将说明它在典型的情况下显 
然是满足的. 

定义3 如果当 u 0 在上一致连续的时候，变换叫的族是等度连埃①的，那么 
核 A ： 是正則的. 

例 （ a ) 卷积.如果 F 是一概率分布，那么卷积 

« n (*) = J Un - i(x - y ) F { dy } 

表示变换 (7.3) 的一个特殊情形.(在这种情形下，利用不言而喻的记号，有 K ( x , I ) = 
F{I - x }.) 这个变换是正则的，因为当 《o —致连续时，存在这样的5， 
使得 K - x "\< 6 蕴含|« 0 ( 〆 ）- « o (，)| < e . 根据归纳法，这保证对于所有的 
n , - UnOOl < e . 


①见本节的第 2 个脚注.我们的•正《性*与希尔伯特 (HUbert) 空间理论中所用的■完全连旗性 • 
相类似. 
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例 （ b ) 令 是单位区间，令 K •是由密度 fc 确 定的， fc 在闭的单位正方形中是连 
续的，那么欠是正规的.实际上 

- UnWS f \ k ( x ', y ) - k {, x ", y )\- \ un - i ( y )\ dy . (7.4) 

Jo 

由归纳法可见，如果 |« o | < M , 那么对所有的 n 也有 | u „| < M . 由于 A 的一致连 
续性，存在这样的5,使得 

当| 〆 - *"| < «5时， Hx ", y )\ < e / M . 

于是对任意 n，ItXnOcO - ^')\ < e . ► 

下列定理中的严格正这一条件是不必 要的. 它的主要作用是排除我们在第1卷 
第15聿中讨论过的可分解周期链这个麻烦. 

定理 1 有界 闭区间 r 2 上的每个严格正的正則核 a ■是遍历的 • 

这个定理在 a 是无界的时候就不成立了，因为 (7.2) 中的极限可能恒等于 0. 
通用的准则可以用平稳测度来叙述.我们知道，称测度 a 关于■为平稳的，如果 
ai = a2 = - - ■ = a , 即如果它的变换 (7.1) 是恒等的. 

定理2 为使严格正的正則核 A ■是遍历的，当且仅当它具有严格正的平穗概芈分 

布 a . 

定理 1 的证明 令 V 0 是连续函数，巧是它的变换 (7.3). 证明依赖于一个显然的 
事实： 对于严格正的核除 vo 为常数的情形外，变换巧的极大值严格地小于 
的极大值. 

现在 考虎连 续函数 no 的变换 u „ 的 序列. 因为是闭的，所以 uo 在上是一 
致连续的，因此序列 {«„} 是等度连续的.从而根据 8.6 节定理3,存在一个子序列 
KJ 一致地收敛于一连续函数恥.于是 u „, +1 收敛于 《 o 的变换 tn . 现在 u „ 的极 
大值 m „ 的数列是单调的，因此 m „ 收敛于一极 限爪. 由一致收敛性，如和外两 
者有极大值因而对于所有的 ®, uo ( x ) = m . 这个极限是与子序列 { u „ J 无关的， 
因此一致地有 Un -* m . 

令 7 D 是0上的任一概率分布，并用 E „ 表示关于它的在 （7.1) 中定义的变换 
7 n 的期望.比较 （7.1) 和 (7.3), 可得 

E „(« o ) = Eo ( u „) -* Eo ( m ) = m . 

E „( uo ) 对任意连续的的收敛裏含存在一个概率测度 a , 使得 7n — a . (见 8.1 节 
定理2,收敛是正常的，因为分布 7 „集中于有穷区间上 .） 由 （7.1) 推出， a 关于 K 
是平稳的 . a 的严格正性是 K 之严格正性的直接推论. ► 
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定理2的证明用 E 表示关于给定平稳分布 a 的期望.对于任意的 uo e C{-oo,oo] 
及其变换叫，我们由平稳性有 E(«o) = E( Ul ) = •••• 此外， E(| U fc|) 随 A 而减少，因 
此 limE(|ufc|) = m 存在 • 

和在上述证明中一样，我们选择一个使的子序列.于是 Un k+l ^V U 
其中讥是如的变换.根据有界收敛性，这就得出 E(u„J ^ E(«o)«E(|u n J) 

E ㈣，于是 

E ( wi ) = E (« o ) = E ( uo)i E(|wi|) = E (|« o |) = m. 

考虑到 A ： 的严格正性，最后一个等式蕖含连续函数不能 变号. 因此，当 E ( tt 0 ) = 0 
时，恒有 v 0 ⑻= 0. 由此，对于任意的初值 uo , 对于所有的 A 我们有 wo (®) = E (« o ). 
这就证明了 《 n(aO — E (« o ), 此等价于在所有连续区间上， K n ( x y r )^ a ( r ). ► 

我们现在把这个理论应用于周长为1的圓上的卷枳，即应用于具有形式 

Un + l (*) = J o « n (* - |/)^{<1«} (7.5) 

的变换，其中 F 是圆上的概率分布，加法被模1所约化 | 见 2.8 节及 8.6 节例⑷ ]. 
这个变换可以写成/? = 5 Tl 及 K ^( x , r ) = - r } 的 (7.3) 的形式.如果 F 

是严格正的，那么定理1可以直接应用，但是我们要证明下列与中心极限定理类似 
的更一般的定理. 

定理 3® 设 F 是圓上的概率分布，饭设它不集中于一个正多边形的顶点上，那么 
F "* 超于具有常數密度的分布. 

证只需证明，对于任一连续函数 uo , 变换 u „ 趋于常数 m (依赖于《 0 )就够了•实 
际上，正如定理1的证明的第2部分所证明的那样，这蕴含收敛于圆上的概 
率分布 A 因为 a-kuo *1 ■于每个连续函数 uo 是常数，所以推出 a 和均匀分布一致. 

为了证明 u„ — m, 我们可以利用定理1的证明的第一部分，不过我们需要重 
新证明下列命题 ：除了 如为常数的情形外，连续函数吻的变换的极大值严格小 
于如的极 大值. 因此，为了证明定理，只要建立下列命题就够了 ：如果 v 0 是这样的 
连续函數，使得且对 于一个长度为 A>0 的区间 J 的所有点： c，wo(a;)<m, 
那么存在这样的 r, 使得对所有的 x,t» r (x)<m. 

因为旋转不影响极大值，所以不失一般性，可以假设0是 F 的增点.如果&是 
另一增点，那么 0,&,26,"., r 6 是广*的增点，并且可以选择这样的&和 》■, 使得 


①对于开直线上的类似定理，见习 《 23和习18 24 . 对 于向可变分布的推广，见 P. L6vy, Bull. Soc. 
Math. France, vol. 67(1939) pp. 1-41; A. Dvoretzky and J. Wolfowitz, Duke Math. J., vol. 
18(1951) pp. 601-607. 
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每个长度为 A 的区间至少包含这些点中的一点（见 5.4 a 节的引理1和系).根据定 

义， r 1 

v r {x) = J o Mx~ y)F r *{dy}. (7.6) 

对于每一点 a :， 可以找到的一个增点 y , 使得 * - 2/包含在 J 中，于是 
v 0 (x - y ) < m . 因此 v r {x) < m •因为 a ; 是任意的，所以断言得证. ► 

注这个证明稍加修改后可以用来 证明： 如果尸集中于具有一个項点在0处的正 
多边形的顶点上，那么 F " ★超于具有相等质量原子的原子型分布.如果0不在原子 
中，那么 F n * 未必收敛 • 

例 ( c ) 设 F 集中于两个无理点 a 和 a + ^上，那么 F "* 集中于两点 na 和 na + $ 
上，且不可能收敛. ► 


8.8 正则变化 


正则变化的概念 （ J . 卡拉马塔于1930年引入的）巳被证明在许多方面富有成 
效，并且在概率论中的应用越来越广泛.其原因将在下列引理中得到部分的说明， 
此引理尽管很简单但却是很基 本的. 本节的例子包含了一些有趣的概率结果，习题 
29和习题 3 0包含一些关于稳定分布的基本结果，这些基本结果可以由引理1以初 
等的方法推出来.(亦见习题 31.) 

我们常常需要讨论在0^或57^5上积分 yPF { dy ) 得出的单调函数 I /,这里 P 
是一分布函数[例如，见 (4.5) 和（4.15)、 (4.16)]. 利用普通的参数变换可以由这样的 
函数 f / 导出一族形如 atU ( U ) 的函数，我们需要研究当 < — oo 时它们的渐近性质. 
如果存在一极限 训 X )， 那么在条件 V >(1) > 0下只需考虑具有形式 a , = ip(l)/U(t) 
的正规化因子就够了.因此，下列引理的范围比乍看起来要广.它表明可能的极限 
所成类是非常小的. 

引理1设 t / 是0^5上的正单调函敷，使得在稍密点集4上 • 



- 妒 (*) 彡 °° ， t-*cx>, 

(8.1) 

那么 

其中 -00 < p < oo . 

1p(x) = x^, 

(8-2) 


奄无意义的符号 a ； 00 只是为了避免例外而引入的.当然，当 a : > 1 B 寸视其为 oo , 
当 * < 1时视其为 0. 类似地， x ~°° 为 oo 或0视 a ;< l 或2：>1而定（见习题 25). 
证明恒等式 
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U(tXlX2) 

U{t) 


U(txix 2 ) 

U(tx 2 ) 


U(tx 2 ) 

~uW 


表明，如果在 (8.1) 中对 2 
且 


i 和 a : = * 2 存在有穷正极限，则对 a 


V>(xix a ) = ^{xi)ip(x 2 ). 


(8-3) 
2亦然， 


(8-4) 

首先假设对某点:^有 V »( xi ) = oo , 那么由归纳法对于所有 n , V ( x ?) = oo ,^ r n ) = 
0. 由于矽是单调的，所以或者 rl ，{ x ) = 或者 # r ) = x -°°. 剩下的是只需对取 
有限 值的妒 证明引理（见习题 25). 由假设的单调性，我们可利用右连续性把矽的 
定义域扩大为全直线.在这种情形下， (8.4) 在所有的点 x 1> a ；2 上成立.于是， (8.4) 
与我们反复用来描述指数分布特征的方程只在记号上有 差别. 事实上，令0： = ¥和 
矽 ( e «) = «(0,关系式 (8.4) 就变成 《(&+&) = u (6)«(6»). 由第1卷 17.6 节知道， 
所有在有限区间上有界的解具有形式《(0 = #. 但是这和 rP ( x ) = x » 是一样的. ► 
称满足具有有限 P 的引理1的条件的函数 C / 是在无穷远处正则变化的，这个 
定义将被扩展到非单调函数上.如果我们令 


(8-6) 


U ( x ) = x ^ Lix ), (8.5) 

那么 U ( tx )/ U ( x ) 逼近 V ,当且仅当对于每个 I > 0， 

具有这个性质的函数称为是缓慢变化的，于是变换 （8.5) 把正则变化变成缓慢变化. 
利用这个亊实来给出正则变化的正式定义将是方便的. 

定义定义在 W 上的正（未必单调）的函数 L 在无穷远点是 緩馒变 化的，当且仅 
当 (8.6) 成立. 

函数[/以指数 p (— oo < p < oo ) 缓慢变化，当且仅当它具有 （8.5) 的形式，其 
中 L 是緩慢变化的. 

这个定义可推广到原点上的正则变化：为使在0点正则变化，当且仅当 
t / Or - 1 ) 在00处正则变化.因此，对于这个概念不需要新的理论. 

正则变化的性质只依赖于在无穷远处的性态，因此不必要求 L ( x ) 对所有的 
* > 0都是正的，甚至不必要求 L [ x ) 对于所有 x >0 都有定义. 

例 （ a ) |1ilc| 的所有次幂在 0 点和在 oo 处都是缓慢变化的.类似地，趋于正极限 
的函数是缓慢变化的. 

函数 （1 + X 2 )* 1 在 oo 点以指数 2 P 正则 变化. 
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e * 在无穷远处不是正则变化的，但它满足具有 p = oo 的引理1的条件.最 
后，2 + sini 不满足 (8.1). ► 

为了易于引用，我们把引理1改写成下列形式. 

定理为使单调函数1/在无穷远处正則变化，当且仅当 (8.1) 在稠密集合上成立， 
且极限故在某个区间上是有穷的且为正的 • ® 

当假定在所有点上都收敛时，这个定理可以搬到非单调函数上去. 

下列引理可用来加深我们对正则变化的理解.它是缓慢变化函数一般形式 (9.9) 
的直接推论. 

引理2 如果1在无穷远处是緩慢变化的，邓么对于任一固定的 e >0 和所有乞 
分大的 rr , 

x~ e < L ( x ) < x e . (8.7) 


在 （8.6) 中所取的极限在有穷区间 0< a < a :<<> 中是一致的 • 
我们以一个常用的准则来结束这个研究. 

引理3 圾设 

-*1 ， o„ -♦ oo. 

如果 y 是草调函数，使得在一个桷密集合上， 


limA „ l /( o „ x ) = x ( x ) < oo 


( 8 . 8 ) 


存在，并且 x 在某个区间上是有哏且为正的，則1/是正則变化的，并且 x (*) = ca ^, 
其中 — oo < p <00. 


证我们可以假设 x ( l ) = 1,且 (8.8) 对 z = 1成立（因为这可由尺度的明显变化 
而得到).对于给定的 t , 把 n 定义为使 o „ +1 > t 的最小整数.于是 a „ < t < a n+1 , 
并且对于非减的 t /. 


UjanX ) U ( tx ) U ( On +1 x ) 
U(On +1 ) 、 U(On) ’ 


(8.9) 


对于非增的 K 相反的不等式 成立. 因为 XnU ( a „) 1,所以两端的项在使 (8.8) 成 
立的每一点上都趋于 x (*) .因此，断言已包含在上一定理之中. ► 

为了举例说明典型的应用，我们首先推导一个应属于 R . A . 费希尔和格涅坚科 
( B . V . Gnedenko ) 的极限定理，然后推导一个新结果. 

①正典I变化的概念可推广如下^代替 （8.1) 中极® 存在这个条件，我们只*求每个趋于无穷的序列 
{<»} 包含一个子序列，使得 U(t„ h x)/U(tn k ) 趋于有穷正 极限. 银么 , U 是控制变化的（见 8.10 
节习 II 末尾). 
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例 （ b ) 极大值的 分布.设变量 Xfc 是相互独立的且有共同分布 F . 设 


X * = mBx [ X u --., X n ). 

我们问，是否存在一个尺度因子 On 使 得变童 义；；/0„有极限分布 G ? 我们排除两种 
情形，因为它们是平凡的.如果 F 有一个最大增点那么 X ；；的分布显然趋于集 
中在 C 上的分布.另一方面，总可以选择这样迅速增加的尺度因子 On , 使得 X*/On 
依概率趋于0,其余的情况为下述命超所包含. ► 

设对所有的 x , F { x ) < 1. 为使对于适当的尺度因子的分布 G „ 超于 
不集中在0上的分布 G ， 当且仅当1 一 F 以栺敷/)<0正則 变化. 在这种情形下， 
对于 a ;>0, 

G(i) = e-^; (8.10) 

对于 * < 0, G (*) = 0( 显然 c > 0). 

证如果极限分布 G 存在，那么在所有连续点上有 

^"( anx ) G ( x ). (8.11) 

取对数并注意当 2 — 0时 ， In (1 - z ) 〜 - 2 , 我们有 

n[l — F ( a „ i)J —* - In G ( i ). (8.12) 

因为在某一区间上0 < G ( x ) < 1. 所以上一引理保证了 1 - F 的正则变化性.反之， 
如果1 - F 是正则变化的，那么可以确定这样的 a „, 使得 叫1 - F ( o n )] - 1. 在这 
种情形下， (8.12) 中的左边趋于见习题 26). ► 

例 （ c ) 卷积.由定义 (8.6) 显然看出，两个缓慢变化函数之和还是缓慢变化的.我 
们现在来 证明： ► 

命 H 如果朽和朽是两个这样的分布函數，使得当 a : — oo 时 


1 一 Fi ( x ) = ⑻， （8.13) 

其中 A 是緩慢变化的，那么卷有这样的正則变化的尾部，使得 

1 - G ( i )~ x - p ( Li ( x ) + La ⑻). (8.14) 

证 令和 X 2 是具有分布和 F 2 的独立随机变 贵_ 设 f = (1 + 5 )t > t . 事件 
Xi + X 2 > t 在一个变童 > t 7 而另一个变量> 一《时发生.当 f — oo 时，后一事 
件之概率趋于 1. 因此，对于任一 e > 0和充分大的 t , 

1 - G ⑺彡【(1 - 巧(0) + (1 - F 2 (0)1(1 - e )_ . (8.15) 
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另一方面，如果我们设 t " = ( l -6) t , 其中0 < 5 < ^,那么只有当两个变量之 
一大于 *〃 或者两个变董都大于 汾时， 事件+ X 2 > t 才可能发生•由 （8.13) 看 
来，很明显，后一事件的概率与事件的概率相比是渐近可忽略的，这蕴含 
对于充分大的 t 

1 - G ( t )< [(1 - F ^ t ")) + (1- F 2 ( t ")) j(l + e ). (8.16) 

因为和 e 是任意小的，所以把两个不等式 （8.15) 和 (8.16) 合起来就可得到断言 
(8.14). ► 

对 r 用归纳法，我们得到有 趣的： 

系 如果 1 一 F ( ar )~ x - PHx ), 那么 1 - F *-+( x ) ~ rx ~^ L ( x ). 

这个定理®在能应用的时候通过提供关于尾部的信息来补充中心极限定理.(对 
于在稳定分布中的应用，见习题 2 9和习题 30. 对于涉及到复合泊松分布的一个有 
关定理，见习题 31.) 

*8.9 正则变化函数的渐近性质 

本节的目的是研究尾部与具有正则变化尾部的分布之截尾矩之间的关系.主要 
的结果是，如果 l - F ( ar ) 与 F (- i ) 是正则变化的，那么所有的截尾矩也是正则变化 
的. 这个结果包含在定理2中，定理 2 包含的内容比讨论稳定分布 Bt 需要的内容要 
多. 可以直接证明它，但也可以把它看作是定理1的系，定理1包含了卡拉马塔® 
给出的正则变化的明显特征.因此，似乎最好要特别地给出理论的完全解释，因为 
论证可以大大简化?> 

我们引入形式上的缩写式 

Zp 、 X 、 = Jo 作⑼办 ， z ;、 x ) = j y p Z ( y ) dy . (9.1) 

现在来证明，当 Z 为正则变化时，这些函数是渐近地与 Z 相关的，正如在简单情 
形 Z ( x ) = x ° 中一样_ 


①波尔特 （S. C. Port) 曾讨论过一些特殊情形. 

* 本节只用于稳定分布理论中，但是在参考文歒中，定理2的利用可以简化许多冗长的计算. 

® J. Karamata, Sur un mode de croiaaance ngulikn, Mathematica(Cliti), vol. 4(1930) pp. 
38-53. 尽管经常参考这篇论文，但是看来没有更新的解释存在.关于 JR 近的推广以及在胄伯定理中 
的应用，见 W. Feller, One-sided analogues of Karamata'a regular variation, in the Karamata 
memorical volume (1968)of L'Bnseignement Math^matique. 

® 尽管这里给出的定理 1 的证明是新的，但我们利用了卡拉马塔的想法. 
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Z p 在无穷远点的渐近性质不受 Z 在原点旁的性质的影响.因此，不失一般性， 
我们可以假设 Z 在0的某个邻域内恒等于0,因此确定 z„ 的积分对所有的都 
有意义. 

引理令 Z > 0是緩慢变化的.对于 P < -1, (9.1) 中的积分在 oo 处收敛；对于 
P > -1, 它在 0O 处发散. 

如果1>彡-1，那么 z p 以指数 P + 1 正則 变化. 如果_1,那么 q 以相數 
p+1 正則变化，并且如果存在，那么这对于 p + l = 0 仍然是正确的. 

证对于给定的: r>0 和 e>0, 选取这样的7?,使得对 

(1 - e ) Z ( y ) < Z ( xy ) < (1 + e ) Z ( y ). (9.2) 


假设 （9.1) 中的积分收敛.由 

Z *( tx ) = J t y p Z { xy)dy 

推出，对于 f >口， 


(1 - e )^^) < Z ；( tx ) <(1 + e ) xP +1 Z ；( t ). 
因为 e 是任意的，所以我们知道，当 t-oo 时 


(9.3) 


(9-4) 


这就证明了％是正则变化的.此外，因为％是减函数，所以 p + 1矣0.因 
此，只有当 p < -1 时， （9.1) 中的积分才可能收敛 • 

其次，假设这些积分发散.于是对于 t>r,, ‘ 

Z p (tx) = Z p (rtx) J y p Z(xy)dy. 

因此 

(1 - e)^ l Z v (t) < Z„(tx) - Zp(ijx) <(1 + e)3^ l Z„(t). 

除以 Z p (t) 并令 t — oo, 如同上述，我们可得 Z p {tx)/Z p {t) 趋于因此，在发 
散的情况下，4是正則变化的，发散只有在 p > -1 时才可能发生. ► 

下一定理证明了，2之正則变化性保证 Z p 和的正则变 化性； 除了 Z p 或 
Z ； 是缓慢变化的情形外，其逆也是正确的.此外，我们得到了关于判别这些函数正 
则变化性的一个有用的准则.定理的 （a) 部分和 （b) 部分分别讨论函数 q 和 Z p . 
它们在各方面都是平行的，但是只有 （a) 部分广泛地应用于概率论中. 

定理1 (a) 如果 Z 以指數 7 正則变化， $ 存在，那么 


t^Z(t) 


(9.5) 
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其中 A = -(p + 7 + l ) ^0. 

反之，如果 (9.5) 对于 A > 0成立，那么 Z 和$分别以指敷 7 = - A - p-l 
和-正則变化.如果 (9.5) 对于 A = 0成立， 那么 Z ; 是缓慢变化的（但是对于 Z 
得不到任何结论). 

( b ) 如果 Z 以栺數7正則变化， JLp ^-7- l . 那么 


~zM~ 


(9.6) 


其中 A=p + 7+ l - 

反之，如果 （9.6) 对于 A >0 成立，那么 Z 和分别以捎數 A - p - l 和 A 正 
則变化.如果 （9.6) 对子 A = 0成立.那么&是缓慢变化的 • 

证两部分的证明是相同的，我们只对⑷部分进行.设 

y p z{y) _ v(y) 
z ； (y) 

左边的分子是分母的负导数，因此对于 x > l 有 

现在假设 Z 是以指数7正则变化的.根据上一引理， q 以指数 A = 7 + P+l 
正则变化，因此 (9.7) 的两边以指数 -1 正则 变化. 于是 r ; 是缓慢变化函数.因此， 
当 t — oo 时， (9.8) 中的最后一个被积函数趋于厂 1 . 遗憾的是，我们不知道77是 
有界的，因此我们只能由法图定理[见 4.2 节 (2.9)] 来断言积分的下极限> In a :. 
但由于％的正则变化性，我们知道左边趋于 A In z , 因此 
lim sup 7/⑻彡入 • 


(9.7) 

(9.8) 


但是这斑含 V 的有界性，因而我们可以选择这样一个序列 — oo , 使得 r ,^)^ 
c < oo . 由缓慢变化性，这 at 含对于所有的 8, rj ( tn 8)^ c , 收敛是有界的.于是 (9.8) 
的右边趋近于 clni , 因此 c = A . 由此推出，极限 c 是与序列 { t „} 无关的，从而 
V ( t ) - A . 这就证明了 (9.5) 是正确的 • 

其逆是比较容易证明的•设 r? ⑷ —A > 0,于是 (9.8) 的两边都趋近于 Alnx , 
因此如所断言，比 Z ；( t )/ Z ；( tx ) 趋近于 a : A 如果 A > 0,那么这和 (9.5) 合在一起就 
证明了 Z 以指数 —A - p - 1正则 变化. ► 

虽然我们以后没有用到它，但是我们还是要叙述下列有趣的， 

系为使函數 Z 是缓慢变化的，当且仅当它具有形式 

Z(*) = a(i) exp (乂 守 dy ) ， （ 9 . 9 ) 
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其中当 I —♦ oo 时， e ( x ) —♦ 0, a ( x ) -+ c < oo . 

证容易验证，右边是一个缓慢变化 函数. 反之，假设 Z 是缓慢变 化的. 利用 
(9.6)(p = 7 = 0), 我们得到 

Z ( t ) l + e ( t ) 

Z 0 ( t ) — ~ t ~ 1 

其中 e ⑷ — 0. 在左边，分子是分母的导数，经过积分，我们得到 
Zo ( x ) = Zo ⑴ •* exp ^ , 

这等价于 （9.9), 因为根据 （9.6) 有 Z (®)~ Zo ^ x )!- 1 . ► 

我们着手把定理1应用于概率分布 F 的截尾矩函数.我们可以单独地考虑每 
个尾部，也可以把它们结合起来，考虑尸⑷-巧-；!：)而不考虑广因此，只需研究 
集中于 0^, 上的分布 F 就 够了. 对于这样的分布，我们把截尾矩函数％ 和％ 定 
义为， s „ 

Uc ( x ) = y < F { dy }, V „( x ) = J ^° y ” F { dy }. (9.10) 

不用说，第 2 个积分收敛，而第1个积分当 x ^ oo 时趋于 oo . 这要求 C >0,- oo < 
»? < C 特别，％ = 1 - F 是分布 F 的尾部 • 

我们证明定理1的 （ a ) 部分的一个推广； （ b ) 部分可用同样的方式推广. 

定理2①假设 t /^ oo ) = oo . 

⑴如果 R 和％中有一个是正則变化的，那么存在极限 

^ =c> 0<c<o °- (9 . U) 

我们把这个极限唯一地写成如下 形式， 

< a < C , (9.12) 

其中如果 C = 00, 那么 = 

( ii ) 反之，如果 （9.11) 对于 0< c<oo 是正确的，那么一定有 a >0, 并且存在 
•-个缓慢变化函数 L , 使得 

U (( x ) ~ (a — rj ) x ( ~ a L ( x ), V v ( x ) 〜 (C — a ) i ， I - a L ( x ). 


其中符号 〜表示 两边之比超于 1. 


(9.13) 
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( iii ) 只要以显然的方式解释符 号〜， 这个陈述在 c = 0或 c = oo 时仍是正确的. 
例如，如果 (9.11) 对于 C = 0成立，那么 a = C ， R 是缓慢变化的，但是关于 
V ,我们只知道 V „{ x ) = o { x ^ L { x )). 在这种情形下，％未必是正则变化的（见习 
题 31). 但是，缓慢变化的情形是函数 R 或％ 这一的正则变化性不蕴含另一函数 
正则变化性的唯一的情形. 

证 ( i ) 我们把％写成形式 


V v (x) = y^Uddy). (9.14) 

在 a : 和 f > a : 之间进行分部积分，我们得到 

V v (x) - V v (t) = -x^U ( (x) + t^U c (t) + ((-”、 J: y^- 1 U <i {y)Ay. 

右端最后两项是正的，因此积分当 t - oo 时应收敛•由 R 之单调性，这蕴含 
y ^ U ^ t ) -» 0,因此 

V v {x) = -x*»-«t/ c (x) + (C- V )J" i/”_ c Xy)dy (9.15) 

或者 

/: 广‘、 w 办 . （9.叫 

现在假设％是正则变 化的. 因为 t/ c (oo) = oo, 所以指数必然彡 C, 我们以 C-a 
来表示它■[因为 (9.16) 中的积分收敛，所以我们必然有 o ^ I7-] 具有 Z = R 和 
P = »7-C-l 的关系式 (9.5) 断言， (9.16) 之右端当 XjiO 时趋于 


_1 + (C _ rj)/(a 一口 ) = (C _ a)/(a~t)), 

当 A = 0 时趋于 oo . 因此，我们证明，如果％以指数 C - a 正则变化，那么 (9.11) 
对于 (9.12) 给出的且 > 0的 c 成立. 

其次，假设％是正则变 化的. 它的指数< %我们以 r,-a 来表示它.我们利 
用相同的论证，除了把 (9.15) 换成类似的关系式 

Ucix) = -*卜*%(*) + ( C ~*?) T y C _ ” _1 V ”( y)dy (9.17) 

Jo 

以外. 于是应用具有名=%和 ？ = <-17-1的 (9.6) 可得 (9.11) 对于由（9.12)(其 
中 a 彡 0) 给出的 c 成立. 
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⑼为了证明其逆，假设 (9.11) 成立，并把 c 写成 (9.12) 的形式.首先假定 
0 < c < oo . 我们由 （9.16) 看出， 


x^Ucjx) 

乂 y^-'Ucmv 



(9.18) 


由定理 1( a ) 直接推出，％以指数> 0正则变化，于是 (9.11) 蕴含％以指数 
V - o 正则变化.由此推出 R 和％可以写成 (9.13) 的形式，其中 a > 0 • 

如果 C = 0,那么用同样的论证可以证明％是缓慢变化的，但是由 （9.11) 得 
不出是正则变化的结论. 

最后，如果 (9.11) 对于 c = oo 成立，那么我们由 (9.18) 断言 

—- ^0, (9.19) 

乂 y C - , - 1 V,(y)dy 

根据定理 1( b ), 这组含&是缓慢变 化的. ► 


8.10 习 题 

1. 收效的另一 定义. 设和 F 是概率 分布. 证明， F „ — F (正常地)，当且仅当对于给 
定的 e > 0 ，fc > 0和 t , 存在一^ N ( e , h , t ), 使得对于 n > N ( e , h , t ), 

F ( t - h )- e < F „( t ) < F(t + h ) + e . (10.1) 

2. 祚正常收敘.如果 F 是亏损分布，那么 (10.1) 蕴含非正常地 - 厂其逆不成立.证 
明， 正常收敛可通过要求 (10.1) 对于 n 彡 N ( e , h ) 成立来定义 • 

3•设 {Fr,} 正常收敛于不集中在一点上的极限.为使序列 {F„(OnX + bn)} 收敛于集中在 
原点上的分布，当且仅当 On OO t bn - o ( a „). 

4•设 X U X 2 ,- 是具有共同分布 F 的社立随机变量， S „ = Xi +--- + X n . 设变量 
d - bn 有一个不集中于一点上的正常极分亨 17. 如果 a „ >0,則 

On -*00, On/On-1 -* 1. 


[提示 I 利用 8.3 节定理2来证明 aan/On 趋近于有穷极限.只要考虑对称分布就够 
了 .K 极限分布是稳定的，见 6.1 节 .） 

5•设 {«„} 是一个有界申调函数的序列，它处处收效于一有界连蠄的极限（极限当然是 
单调 的). 证明^收敛是一致的•[提 示： 把坐标轴分成一些子区间，使得 ti 在毎个子区间 
上的变化小于 e.l 

6•设集中于 rT 1 上， u ( i )= 8 in (* 2 ), 则 Fn^u - «处处成立.但非一致成立. 
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7. ( a ) 如果 ( X „, y „) 的联合分布收敛于 { X , Y ) 的联合分布，那么 X „ + Y „ 的分布趋于 

X + F 的分布 • 

(b) 证明 8.3 节定理 2 是一^殊情形. 

( c ) 如果只知道和 V „ 的边缘分布收敛，那么上述结论一般不成立. 

8. 设 — F , 且 F 是亏损的.如果 《i € C 0 (- oo , oo ), 则在每个有穷区间上一致地有 
F n - ku ^ ■(这 推广了 8.3 节定理 1.) 

9. 如果非正常 地有凡 — F , 那么 F n irFn ^ F - kF 不一定成立. 

倒.令在点 - n ,0 和 n 上具有重量为 | 的原子 • 

10. 在乎面内，毎个在无穷远处等于0的连续函数可以用有穷线性组合来 
一致逼近，其中外及叭是无穷可微的. 

[提示 • 利用 8.3 节例 （ a), 选取 G *( i , y )=« n t ( a ：)« H ( i ,), 其中饥是一正态分布 •] 

度量函数 P 称为概率分布的 矩离* 教，如果 p ( F , G ) 对于每对*率分布 F , G 是有 
定义的，且有下列3个性质 I p ( F , G ) > 0,且 p { F , G ) = 0当且仅当 P = G « 其 
次， p ( F , G ) = p ( G , Fh 最后， p 满足三角形不等式 

p ( Fi , F 2 ) ^ p ( Fi , G ) + p ( Fi , G ). 

11. P - 列维度量•对于两个正常分布 F 和 G , 把 P ( F , G ) 定义为使得对于所有的 z , 

F ( x - h )- h ^ G ( x ) ^ F(x + h ) + h (10.2) 

在所有的 fc > 0时的下磽界.验证 p 是一距离函败.证明，为使 F 为正常的，当 
且仅当 p ( F „, F )^0. 

12. 以 ••离 差*表示的跎离.设 〆 J ； G ) = 8 upHSu -0 ti ||, 其中 u eco ,|| t *|| = i . 证明 p 是 
距离函数.①如果 F 和 G 是原子型分布，且对点各自賦以重董 P * 和办， 那么 

p ( F , G ) = E | p », - 4 fc |. (10.3) 

如果 F 和 G 有密度/和那么 

p ( F , G ) = J^° \f(x) - S (x)|diE. (10.4) 

[提示 I 只要对连续的/和 S 来证明 (10.4) 就 够了. 一 JR 的情形由遥近推出 .1 

13. m 证明 P ( F „, G ) — 0蕴含正常收敛 -* G . 为了说明其逆是不正«的，考虑正态 
分布函败 m ( nx ) 和集中于 rT 1 上的分布 

①这个定义可扩展到任意有穷 * 度之整上，并 & 可以定义 测度的 ■ 范数拓扑 * . 习 * 13 说明所产生 
的收败概念对于概率论是不自然的 . 
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14. (埃）如果 t / = F 1 * . . .* F „，= G 1 *" * G „, 证明 

P (. U , V ) < J 2 p (^ F k , G h ). (10.5) 

这推广了基本不等式 （3.9) •【提 示： 利用 （3.9) 和一个使得 ||Uu - Bu || 接近于 p ( U , V ) 
的测试函数 u .] 

15. 用泊松分布逼边 ? 1 . 设 F 对点1賦以质量 p , 对点0賦以质量 g = 1 -1> •如果 G 是期 
望为 P 的泊松分布，证明 I p ( F , G )< | p 3 , 其中 p 是 (10.3) 所定义的距离.证 明：如 
果 F 是 n 个具有概率 pi , 的伯努利试验中成功次数的分布，并且 G 是具有期 
望 p l + ...+ p „ 的泊松分布，那么 p ( F , G )< j ( p ? + 

16. 7.7 节中的大数定律说明，如果； f fc 是独立同分布的，而且如果 Ed ) = 0 ,那么 
(沁+…+ X n )/ rt ^ O . 试用 8.4 节定理 1 所用的方法来证明这个结论. 

17- 如果叫= E (| Xd ) 对于某个 <5 > 0存在，并且 m +… + a „ = 5 (把*)(李亚普诺夫 
( Liapunov ) 条件)，那么它们就必然满足林德伯格条件 (4.15). 

18•设八是对称的，并且对 x > 1,1 - F k ( x ) = \ x- 2 ~ l ' h . 证明它们不满足林德伯格条 
件 (4.15). 

19. 设以概率 |(1 - fc _ 2 > 有 X k = ±1, 以概率 Ifc ~ a 有 X * = ± fc , 利用简单的截尾法来证 
明， S „/ y / H 的渐近性质和以概率 | 有 X * = ±1的情形一样.因此， Sn / v/H 的分布 赵 
于 91 而 Varpn/v^) — 2. 

20. 编出上埋的变形问题，使 E ( XJ ) = oo , 且 5„ A / S 之分布还是趋于 01. 

21. ® 可交换变量的中心极 ff ■定 a . 对于固定的0,令 是 期望为0,方差为 a\0) 的分布. 
按照概率分布 G 来选择0的值，我们考虑具有共同 分布丹 的相互独立变量 X „ ，如 
果 a a 是/关于 G 的期里，证明 S n /{ ay / n ) 的分布趋于分布 

J °° ai ( oa :/< T ( e )) G { dfl }. 

只有当 G 集中于一点上时，它才是正态分布. 

22. 其空管中的起伏哚 声等.考虑具有离散化了的时间参数的 6.3 节例 （ h ) 中的随机过程. 
假设在时刻 fcfc 有一电子到达的概率为 ah , 证明：在离散模型中的电流强度由 无穷卷 
积 给出. 取极限 /I — 0导致 6.3 节 (3.4) 坎贝尔 （ Camphell ) 定理. 

对占线的 6.3 节例⑴作同样处理.把这个模型推广到下列情形，在时刻 fch 的后效是 
以概 率 Pt ， 灼， …取 值 1,2,... 的随机变量. 

① 这是受 L_ Le Cam, An approximation theorem for the Poisson binomial dutribution, Pacific 
J. Math, vol. 10(1960) pp. 1181-1197 中的不等式的启发而撼出的 . 

② J. R. Blum, H. Chemoff, M. Rxwenblatt and H. Heidier, Central Umit theorems for inter¬ 
changeable processes, Canadion J. Math., vol. 10(1958) pp. 222-229. 



23. 序列 { F n *} 决不是随机有界的.【提 示： 只需考虑对称分布就够了.而且我们可以假设 
F 具有无穷尾部，否则根据中心极限定理，有 0. 利用 5.5 节 (5.10).] 

注在 15.3 节例⑷中将证明 

24. ( 续）然而可能有：对每个 a :, 

lim supF n *(a:) = 1, lim inf = 0. 

事实上，可选择两个极迅速增加的整败 a * 和 n * 的序列，使得 

[提示，考虑分布 P{X = (- l )* a fc }= p fc . 选取适当的常数，下面的亊件有非常大的概 
率，在诸项久丨，…， X n )1 中，有 2 fc 个项等于 （-1)*^, 且没有一项的绝对值大于 a *. 
于是对俩败 fc , S „ 4 > a k — n fc a fc _,. 证明 

n* = (2*)!, p »： ~ ( 2Jfc - 1 )! ' a * ~ ( 似 )* 

肪了 .】 

25 . 在 8.8 节引理1之证明中，只需假设集合4在某个开区间中是稠密的就够了 • 

26. 极大值的分布.设 Xi , …，尤„是具有共同分布 F 的独立变 JtX ；： =_(&, …，； f „). 
令 G „ 是的分布. 

⑷如果 F ( x ) = 1- e -*, o „ = r » ,那么 G „ 趋于集中在点 0 上的分布.直接证明， a „ 
的任何选取也导不出更有差别的结果. 

( b ) 如果尸是具有密度 w (1 | ia ) 和 o „ = n /; t 的柯西分布，那么对于 x >0, G „( x )— 

27. 如果 X 和 y 有这样的共同分布 F , 使得对于一个缓慢变化的 L , 有 l - F ( x ) ~ x -» L { x ), 
那么当 * — 00时 P { X > t|X + y > t }- g . 粗略地说，和的大败值好傢是由于两个 
变量之一的责献 . a 

28. 在 IT 55 上令 v > 0 ，a > 0,并假设 

+ b ( t ) z ] = z ( x ) 

存在且连续地依赖于 a :. 对于固定的* 0 > 0,证明^是正则变化的.证明 I 
如果”本身不是正则变化的[在这种情形下， *(*) = c - x a + c lX ), 那么或者 *(*) = cr ", 
或者 z ( x ) = cx + cix In *. 

2 9 •设 G 是对称稳定分布，即 GTicrx ) = G (*)( 见 6.1 节).用 8.8 节最后一个系来证明， 
如果 r[l - G ( crx )) t 不趋于0,那么1 - G ( x ) ~ x ~ a L ( x ) (其中 a < 2). 而且当 
r[l - G ( crx)]t — 0时 ， G 是正•布. 

[提 示， 根据 5.5 节 (5.13) 对称化不等式，序列 r|l - G ( crx )] 是有界的，其余的是容易 
的 .] _ 

①像这样的现象好像是 B . 芒德布罗首先注意到的. 
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30. 把上題推广到非对称稳定分布的情形. 

31. 设 { X n } 是相互独立正随机变量序列，且具有集中于0^5上的共同分布 F . 设尺是 
一^泊松变量.随机和 Sn = X ! + ..-+ X w 有复合泊松分布 

设 L 在无穷远处是缓糧变化的. 证明： 

如果 1 _ F(x)~ aT p L(:c), 则 1 一 1/(*) ~ cx- p L(x). 

[提 示： 显然 P {5 N > a ：} 大于诸分量中恰有一个 X i > X 的概率，即 


1- U ( x ) ^ c[l - F(t)]e- cll_F(,)1 . 

另一方面，对于充分大的 A 事件> * 不可能发生，除非诸分量中有一个 Xj > 
(ls)x, 或至少有两个大于*〃 3 ,或最后 7V > “. 第2个事件的概韦是 o(l-F(*)), 
而 JV > In :r 的概率比 a: 的任意幂趋于0的速度都快 .1 
3 2 •设尸是 -- 个原子型分布，在点 2 "上具有与成正比的 质量. 证明I (9.10) 中 
所定义的 t/ 2 是缓慢变化的，并且 t/ 3 (oo) = oo, 但是1 - F 不是正则变化的. 

[提示 • 对于最后一个陈述，只要考虑跳跃度就够了 .1 
注其余的问题涉及正则变化概念的推广 .® 下列定义提供了方便的起点. 

定义单调*教 u 在无穷远处是控制变化的，如果比 u(2x)/u(x) 保持0和 oo 以外的 
有界值. 

33. 证明^为使非 喊函数 u 是控制变化的，当且仅当存在常数 >l,p 及 to, 使得 

I t > to, i > 1. (10.6) 

对于非增的 t*, 只要把 * > 1 换为: r < 1,同样的准则是适用的. 

34. (9.2 笮定理 2 的推广)如同 (9.10) 那样定义 l/ c 和％(这赛求 -oo < n < <) .令 

证明， 为使 t/ C 是控制变化的，当且仅当 lim sup R { t ) < oo. 类似地，为使V,是控制 
变化的，当且仅当 lim inf R ( t ) > 0. 

38.( 续）更确切 地说： 如果对于 t > to, fl(t) < M , 那么 

矣 （M + l)®**, *>l,t>to, (10.7) 

①对于进一步的结果和却节，见 W. Filler, One-sided analogues of Karamata'a regular variation, 
in the Karamata Memorial Volume of l'Enseignement Math^matique, vol. 15(1969) pp. 107- 
121. 又见 W. Feller, On regular variation and local limit theorema, Proc. Fifth Berkeley 
Symposium Math. Statistics and Probability, vol., 2, Part 1, pp. 373-388(1065-1966). 



其中? > = (< - »?) M/(M + 1). 反之，具有 p < C -的 (10.6) 蕴含 

«(t)< (10.8) 

如果把 i ? 换成它的倒数同时把比 U c ( tx )/ U ( ( t ) 换成 V n ( t )/ V v ( tx ), 那么上面这 
陈述仍是正确的. 

36. 证明下列准则 •. 如果存在一个数《> 1,使得 lira inf U c { st )/ U ( ( t ) > 1,那么％是控 
制变化的.类似地，如果 lim inf V v ( t / a )/ V v ( t ) > 1,那么 R 是控制变化的. 



第 9 章无穷可分分布与半群 

本章的目的是要说明关于无穷可分分布、独立增量过程、稳定分布及其吸引域 
的一些基本定理，可以由用来证明中心极限定理的论证的一种自然推广来推导.我 
们将 用傅里 叶分析的方法 t 新讨 论并扩充这 一* 论， 因此我们现在仅局限于叙述 
一 些基本亊实.本章的主要兴趣是方法论性质的，即要把现在的课题和马尔可夫过 
程的一般理论联系 起来； 当可以应用的时候，傅里叶分析的方法可导致更深刻的结 
果.为了使一些重要的事实容易理解， 一些 定理将被证明 2次. 因此，一般的结构 
定理是首先对方差存在的分布半群证明的.这样， 9.1 节 〜 9.4 节对基本亊实的陈述 
是自给自足的. 

本章的半群算子是卷积.其他的半群将在下一章中用新的方法独立地考察. 

9.1 概 论 

本章的极限定理是中心极限定理的一种自然推广，无穷可分分布与正态分布 
有密切的联系.为了看出这一点，在稍微不同的背景上重复 8.4 节中定理1的证明 
是值得的. 

这一次我们考虑任意一个三角形阵列 { X k , n }, 其中对于每个 n , n 个 变董① 
X l < n ，…， X „'„ 是独立的，且具有共同的分布 F „. 对于行和，我们记 S „ = X lin + 
••• + X „, n . 在第8章中，我们讨论了 X k , n = AC 1 和凡⑻= F ( o n a :) 这种特殊 
情况.在那里，行和记为 S ；：. 

在本章中，我们利用 8.3 节中的算子记号.因此， y „ 是与对应的算子，抑 
是与的分布对应的算子.最后， || u || 表示连续函数|«|的上确界. 

例 （ a ) 中心极 ff ■定理.假设存在这样的数 — 0,使得 

| Xi , „| < c „, E ( A - lin ) = 0, nE ( X ?，„) — 1. (1.1) 

对于一个具有 3 阶有界导数的函数 u , 我们有恒等式 

„[«,)-« ( x )]=£ 吵二 • ny2Fn{dy} {12) 


①三角形阵列*在 6.3 节中定 义的. 应当记住，我们实际上讨论的是分布函数随机变量 X fc , n 
只是用来简化记号的.因此，不同行的变纛不必有任何联系（并且不必定义在间一撅率空间 上). 
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根据假设，有限测度 ny 2 F n { dy } 收敛于一个集中在原点上的概率分布.积分号下的 
分式是 y 的一个连续函数，它与 \ n "{ x ) 之差小于 e „| K ||. 因此， 关于 ： r 一致地有 

- u ] — ^ u ". (1.3) 

现在假设 {«„} 是另外一个算子序列，使得—致地收敛于〃.那 
么一致地有 

«[5 nU - © n «] -» 0. (1.4) 

根据 8.3 节基本不等式（3.10)(以后将经常使用这个不等式） 

|| 扣 u - 0»| $ n ||5„ u - 0„ u ||, (1.5) 

右边由于 (1.4) 而趋于 0. 正如我们在 8.4 节的定理1的证明中所看到的，我们可 
以把取作与方差为 1 A » 的对称正态分布相对应的算子.于是= ® i . 因此 
耵 -® i . 这样我们证明了 5„的分布超于正态分布沉 ► 

仔细观察这个证明的结构就可以看出， (1.3) 右边的形式不起作用.假设我们有 
这样一个阵列，使得一致地有 


n [5 „u - u ] -♦ iXu , (1.6) 

其中 ii 是一个任意固定的算子，我们的论证容许我们把两个满足 （1.6) 的阵列加以 
比较，并且可以得知它们的行和的渐近性质是相同的.如果对一个这样的阵列， 
的分布趋于一个极限 G , 那么这对于我们所有的阵列都是正确的.我们将证明这总 
是正确的. 

例 （ b ) 泊松分布.设 X lin 以概率 p „ 等于1,以概率1 - p „ 等于 0. 如果 - a , 
那么 

n [5„ u ⑻- «( i )] = np „ ( u(i - 1) - «(*)] a [ u ( a : - 1) - u (®)]. (1.7) 

这一次我们取 ®„ 为与期望为 a / n 的泊松分布对应的算子.简单的计算表明， 
n [(8 „u - u \ 也趋于 (1.7) 的右边.因此，与前面一样，我们得到〜 0 L 于 
是的分布趋于期望为 a 的泊松分布 .[(1.7) 的右边给出了 (1.6) 中算子 il 的一种 
可能形式.关于简单三角形阵列的另一个例子，见习题 2.] ► 

在我们这两个例子中，由干预先知道极限分布，所以我们是很幸运的.一般说 
来，将用这样的三角形阵列来确定极限，这样我们将推导新的分布 函数. 在第1卷 
第6章中曾用这种方法把泊松分布定义为二项分布的极限. 

我们由 6.3 节知道，和的极限分布称为无穷可分的.我们将证明，当形如 
(1.6) 的关系式成立时，这样的极限分布存在，而且还将证明这个条件也是必要的. 
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研究这个问题的另外一种方法依赖于对测度 n ^ Fnldy } 的研究.在上述两个例子 
中，极限测度是存 在的. 在例 （ a ) 中，它集中于原点上；在例 （ b ) 中，它集中于点1 
上.一般说来，关系式 (1.6) 与这样的测度0的存在性有密切的联系，这个测度使 
得 ny 2 F n { dy ) ^ Sl { dy }, 我们将用算子 U 或测度可能是无界的）来刻划无穷 
可分分布的特征. 

研究这个问题的第三种方法从解下列卷积方程 开始： 


Qa^Qt = Qa+ti 


(1.8) 


其中 Qt 是一个依赖于参数 t > 0的概率分布. 

例 （ c ) 正态分布和泊松分布满足 (1.8), 其中 f 与方差成正比 . 2.2 节 (2.8) 的 r 分 
布满足2_2节 (2.3) 卷积性质，它是 (1.8) 的一个特殊情形.对 2.4 节 (4.5) Cauchy 分 
布和 2.4 节 （4.7) 单侧稳定分布导出的类似的卷积性质也是 (1.8) 的特殊情形. 

对于具有& = Qi/ n 的三角形阵列，当 t 跑遍…时， (1.6) 成立.我们希 
望，当 f 以任意的方式从右边趋于0时， (1.6) 都成立. 

(1.8) 是平穗独立增量过程的基本方程 （6.4 节)，且与半群理论有密切的联系. 
在这里 U 作为 •生 成元- 出现. 原来这个理论提供了讨论极限定理和无穷可分分布 
的最简易的方法，因此我们就从它开始. 

9.2 卷积半群 

对 t > 0,设 Q t 是 R 1 中的一个满足 (1.8) 的概率分布， Q ( t ) 是对应的算子，即 
£ I ( t ) u ( a :) = J ti ( a :- i /) Q t { dy }. (2.1) 

那么 (1.8) 等价于 

Q(s + t ) = Q ( s ) Q ( t ). (2.2) 

称满足 (2.2) 的算子族为半群.[它不是群，因为一般说来 £1(4) 没有逆算子 .! 半群的 
算子可以是各种各样的算子.为方便起见，我们用一个词来表示 Q ( t ) 是与一概率 
分布对应的这一要求. 

定义1 卷积半群 { Q ( t )} (其中 t > 0) 是与概牟分布对应的且满足 (2.2) 的舁子族. 

我们取 C 0 [- oo ,+ oo ] 作为定义域.算子 Q ⑴是转移算子，即0 < u < 1蘊含 
0< 彡 1,且我们有 Q ( t)l = 1. 

我们将需要讨论不是对所有连续函数都有定义的算子陶 (1.3) 中的 dVdx 2 ]. 
幸好目前可以避免关于这类算子的精确定义域的冗长讨论，因为我们需要考虑的 
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只是这样的函数 u 所构成的类，使得 U G C[-oo,oo], U 的各阶导数都存在且属于 
C[-c»,oo]. 称这样的函数为无穷可微的①，用来表示这样的函数构成的类.目 
前我们只考虑这样的算子定义在上，且使得因此所出现的算 
子都可以看作是从 C 00 到 C~ 的算子.对于与概率分布对应的算子，我们在 8.3 节 
中巳经证明，为使；当且仅当对于 u e 我们现在把这个收 

敛定义推广到任意算子上. 

定义2 设和 U 是从 C ~ 到的算子.如果对于每个 ueC ~, 

Ililnu-Htill-O, (2.3) 


那么我们就称 iin 收效于 ii, 用符号表示就是 

于是 (2.3) 说明一致地有 U„« Uu. 反之，如果对于毎个 u € C°°, 序列 {il„u} 
一致地收敛于一个极限 v€C°°, 那么可以用 uu = « 定义一个算子 u, 显然 u„ — a 
定义3 称卷积半群{^⑴}是连续的，如果 

Q(A) -»1, h-^0+, (2.4) 

其中1是桠等算子.在这种情形下，我们令 0(0) = 1. 

因为 ||Q(«)u|| < ||ti||, 所以由定义 （2.2), 对于 A > 0有 

||Q(t + /i)u- Q(t)u|| ^ ||Q(/»)u-ti||. (2.5) 

对于充分小的/»,左边小于一^与 t 无关的 €. 在这种意义上，连续卷积半群是一致 
连埃的. 

定义4 称从 C°° 到 C7~ 的算子 U 产生一个卷积半鮮 {Q(t)}, 如果当九 一f 0+时， 
^[QW-lJ-iL (2.6) 

等价地，我们称 U 是一个生成无 .® 

更明确地说， 就是： 当极限存在时，算子 U 可由下式定义 ■ 

t_1 J l«(* ~y)~ -»(2.7) 

显然，有生成元的半群自然地是连 续的. 我们将证明所有的连续卷积半群都有 
生成元，但这决不是显然的. 

①类 c~ 只是为了避免新术语而引入的.可以把它换为由所有具有（例如 )4 阶有界导数的 a 败所构 
成的类或由所有具有任意期望与方差的正态分布函#的线性组合构成的类. 

® 因为我们把 U 的定义域局 S 于 c °°, 所以我们的术语与 E. 希尔和菲利普斯 （R. S. PhilUpe) 合著 
的书 (1957) 中叙述的标准用法稍有不同. 
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在形式上， （2.6) 把 II 定义为 Q ⑷在 t = 0处的导数.它的存在性蕴含在 f > 0 
处的可微性，因为当 h ->0+ 时， 


Q(t + h )- Q ( t ) _ Q ( ft ) - 1 




对于是类似的. 

以后将会用到下列例子. 
例 （ a ) 复合泊松半群.设 


£ 誓 … 


Qt = e~ at 

是一个复合泊松分布.这里 

Q ( h)u - u = ( e -° fc - l )« + afte - Qh [5 u + { ah /2 \)^u + •••】• 


(2.8) 


(2-9) 


( 2 . 10 ) 


用 l //» 乘上式我们就可看出（ 2 .6)对 U = a ( S - l ) 成立.因此，复合泊松半鞾 (2.9) 
是由 £»(；? —1) 产生的，我们将用缩写式表示它的元索 • 

例 （ b ) 平移.用 T a 表示集中在 a 上的分布，用 T ( a ) 表示对应的算子.对于固定 
的 /3 > 0, 半群性质 T 0 a - kT 0t = T 0( a + t ) 成立， T(/Jf)u(x)=ti(i- /3<).T(/?t)u 的图形 
是通过平-移 u 的图形得到的，因此我们称这里的半群为平移半鮮.生成元为-办£. 
注意，这个生成元是- 1)( 其中 a = P / h , F 集中在 A 上）当 ft - 0 时的极 | S . 
a(5-l) 是一个差分算子，取极限曾在 7.5 节中研究过.用 I(t) = exp (-洱去)表 
示这个半群是很有启发性的. 

例⑻生成元的 加法. 设从和 U 2 产生卷积半群 { Q〆 *)} 和 {£ J 2 ( i )}. 那么 
叫 + il 2 产生由算子 Q ( t ) = QiWQa ⑴构成的卷积半群.[若 Q : ⑴和 Q 2 ( t ) 分别与分 
布巧和 F 2 对应，则 Q ( t ) 与巧和 F 2 的卷积 对应； 见 8.3 节定理 2.] 通过简单的 
重排， 


Qi(h)Q a (h) - 1 
h 


_ Oi (/») - 


- + Qi(h) : 


Qi ( h ) - 


( 2 . 11 ) 


断言是显然的. 

例 （ d ) 平移了的半群•作为一个特殊情形，我们得到下列 法则， 如果 il 产生一 
个由与分布 Q * 对应的算子 Q ( t ) 构成的半群，那么 U _ 0 d / dx 产生这样一个半群 
{£ J # W }， 使得 Q ?0«0 = Q t 0 c - 所). 
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例 （ e ) 正态半群 .设 Q t 表示期望为0、方差为 rt 的正态分布.正如已经说过的 
那样，这些 Qt 确定一个半群，我们来找它的按照 (2.7) 定义的生 成元. 根据泰勒公 
式， 

«(* - y ) - u ( x ) 

= - yu \ x ) + ^ y 2 u "{ x ) - ^ y 3 u'"(x - 0 y ). (2.12) 

Qt 的3阶绝对矩与 <3 成正比，因此我们可以看出，对于具有3阶有界导数的函 
数， (2.7) 中的极限存在且等于 icu w ( x ). 我们用 U = icdVdx 2 表示这个 算子. ► 
(关于进一步的例子，见习题3〜习题 5 .) 

关于相克-普朗克方 程的注考虑由 v ( t , x ) = Q ( t )/( i ) 定义的函数族.关系式 (2.8) 说明, 
对于光滑的/, 

尝 = Uv . (2.13) 

这是过程的福克普朗克 （ Fokker - Planck ) 方程， t ; 是它的满足初始条件«(0,*) = /( a :) 的 
唯一解.方程 P .13) 描述了这个过程，不必要的复杂化是由于想把 (2.13) 换成一个关于转 
移概率 Q , 本身的方程这一个传统的试图引起的.例如，考虑由 U = - 1) - 0 ^产生 

的平移了的复合泊松 半群. 当初始函数 /( a :) = t ;(0, x ) 有连续的导数时，福克- 瞀 k 克方 
程 (2.13) 成立.对于转移概率，它的形式上的类似方程是 

警= -0^ - aQ t + aF - kQt . (2.14) 

只有在 Q 有密度的时候，这个方程才有意义，因此它不适用于离散过程.通常利用 (2.14) 
而不利用 (2.13), 显然这只能产生麻煩. 

9.3 预备引理 

在本节中，我们收集了整个理论所依赖的一些简单引理.尽管下列不等式非常 
简单，但它们却是很基本的. 

引理1 如果11和 il # 分别产生卷积半群 { Q ( t )} 和 { Q # ( f )}， 那么对于所有的 
t >0, 

|_u - Q *( t ) u \\ < iX # u ||. (3.1) 

证由半群性和基本不等式 （1.5), 我们得到，对于 r = l ,2，---， 

||£1⑴ u - Q # («)u|| 叫卜 (^) u - Q # (J) u| | 

Hl 3 ^- 茅 "II. ㈣ 
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当 r — 00时，右边趋于 （3.1) 的右边，因此这个不等式是正确的. ► 

系不同的卷积半群不可能有相同的生成元. 

引理 2 (收敛 .） 对于每个 n , 设11„产生一个卷积半群 { QJt )}. 

如果 Hn — il , 那么 il 产生一个卷积半群并且对于每个 t >0，£2„(0 — 

m - 

证对于每个 t > 0,序列 { Q „( t ) ti } 一致收敛，因为根据 （3.1), 


|| Q „( t)u — Q m ( t ) u \\ < t || U „«-(3.3) 


因此，按照 8. 3 节的准则 1, 存在一个与一概率分布对应的算子 Q ( t ), 使得 Q „( t )— 
Q ⑴.于是 

Qn (» + t ) = Q „(4 Q „ ⑴— Q ( fl ) Q ( t ) (3.4) 

(根据 8.3 节的定理 2), 因此 {£!(«)} 是一个卷积半群.为了证明它是由 II 产生的， 

注意 

_ 叫卜 ||9 ^ u _ 叫卜 

当 t — 0时，右边第1项趋于 || U„ u - Utxll •在 （3.3) 中，令 m 4 oo , 我们看出第2 
项< ||ilu - 因此，对于固定的 n , 左边的上极限 < 2 || Uu - a „ u ||, 选择 ri 充 
分大，可以使 2 || 11 «- 14 ,«||任意小. > 

根据下列引理，似乎至少 应有： 每个连续卷积半群都有一个生成元. 

引理 3 设 {£2(0} 是一个连续卷积 半鮮. 如果对某一序列 hfe ，...,—。， 


Q(tfc) - 1 
~ h 




(3-5) 


那么 IX 产生半群{❶⑴}. 

证称左边为 iU . 正如在 9.2 节例 （ a ) 中所证明的那样，这个 U * 产生一个复合泊 
松半群.根据上一引理，存在一个卷积半群它是由 U 产 生的. 为了证明 
Q *( t ) = Q { t ), 我们按 （3.2) 中的方式进行，以便得到 

||Q(rt fe )u - Q # (rt k )u|| ^ rt k ||ll fc u- ~ 1 uj|. (3.6) 

令 fc — oo，r — oo , 使得 rtn -> t . 右边趋于0,左边由于 (2.5) 而趋于 || Q ( t )« - 

上述的几个引理马上就要被 用到. 下一个引理之所以被记录下来，是由于它只 
是引理2的一种变形，证明几乎是相 同的. 我们只利用= n 和 t = 1这一特殊情 
形，这种情形将把三角形阵列与卷积半群联系 起来. 
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引理4 对于每个 n , 设5„是与概率分布对应的算子.如果 

1 )- 11 , ( 3 . 7 ) 

那么 II 产生一个卷积半群 { Q ( t )}. 如果 n -» oo ，>— t , 郢么 

扣"—琳 (3-8) 

特别地，5^ -* 0(1). 如果 n 局限于一个序列 m , n 2 , …，那么引*仍然成立 • 

证 (3.7) 的左边产生一个复合泊松半群 [9.2 节例 （ a )], 因此根据定理2, IX 是一个 
生成元.根据基本不等式 （1.5), 

||5 ^"u - Q ( t »„/ n ) u || < r n / n || n [5 „u - u ] - n [ Q ( l / n ) u - u ]||. (3.9) 

对于 ueC°°, 范数符号内的每一项都一致地趋于 Ihi . ► 


9.4 有限方差的情形 

具有有限方差的分布的半群特别重要，它们的理论是如此简单，以致于值得特 
别论述.许多读者对较复杂的一般半群不感兴趣，对于其他的读者，本节提供了有 
趣的介绍性的例子. 

我们考虑一个卷积半群 {0(0}, 用 表示有关的概率分布.假设 Q t 具有有 
限方差 d ⑷.由半群性知 /(a + t) = 0^(8) + ( T 2 ⑷，这个方程①的唯一正解具有 
<r 3 (t) = ct 的形式. 

假设这样规定 Ot 的中心，使得的期望为 0. 那么2阶矩导出一个由下式定 
义的概率分布 

Wy} = ^y 2 Qt{dy}. (4.1) 

根据选择定理，存在一个趋于0的序列 { f n }, 使得当 f 跑遍这个序列时， n t 趋于 
一个可能为亏损的分布 a 

因为 Q t 的中心是这样规定的，使得其期望为0,所以我们有恒等式 

^tzl u{x) = c f^ ^-v)-^)+^(x.) nt{dy}) (42) 


①方程屮(》 + «) = ¥>(*) + V ( t ) 称为哈梅尔 （ Hamel ) 方程.令 u ( t ) = e ^- C ), 我们得到 + t ) = 
u («) u ( t ), 这种形式的方程我们巳遇到几次了，且曾在第1卷 17.6 节中讨论过 .<? t 的期® 也是 
Hamel 方程的解，因此它或者具有 mt 的形式，或者非常奇特.见 9.5 节. 
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被积函数(对于固定的 I )是在原点取值 | u 〃 Or ) 的 y 的连续函数.被积函数及其导 
数在无穷远处等于 0. 这蕴含，当 t 跑遍 { t „} 时 ， fit — J 1, (4.2) 中的积分一致地趋 
于关于极限分布 n 的类似积分.根据9_3节引理3,这意味着我们的半群有一个生 


成元 U , 它由下式 给出: 



ilu ( z ) 

- cj +0 ° u { x - y ) - u i x) + vu ，( x ) n { dy }. 

(4.3) 

il 的这个表达式是唯一 

的 ，因为对于形如 




(4.4) 

的函数，我们有 

1 M 0) = cj r ^^ Sl { dy }. 

(4.5) 


因此，当知道 ilu 对于所有的 u e 的值时,就可唯一地确定测度 ( l + y 2 )- 1 ^}, 

从而确定 n 本身. 

由这个唯一性知，极限分布 n 与序列 {*„} 无关，因此当 t 以任意的方式趋于 
0时， n t { dy } - n { dy }. 

我们将证明，是一个正常概率分布，每个形如 (4.3) 的算子是一个生成元.证 
明依赖于包含在下列例子中的两种特殊情形. 

例 （ a ) 正态半群•当 fi 是集中在原点上的概率分布时， (4.3) 化成 U «( x ) = 
\ cu "( x ). 我们在 9.2 节例 （ e ) 中曾看到，这个 ii 产生一个由期望为0、方差为 
ct 的正态分布构成的半群.容易直接验证，分布趋于集中在原点上的概率分布. 
例 （ b > 复合泊松半群.设 F 是集中在区间 M > »7上的概率分布，它的期望为 
mi, 方差为 9.2 节例 ㈤ 的复合泊松半群的分布 Q t 的期望为 a mi t . 方差为 
am 2 t . 此半群是由 a ( ff - l ) 产生的.根据 9.2 节例⑷，若重新定 Q t 的中心，使其 
期望为0,则这样得到的分布构成一个半群，这个半群是由 

a[S — 1 — mid / dx ] 


产生的，即是由 

ilw ( i ) = f [ u(x - y )- «( x ) - yu , (®)] i ;, { dy } (4.6) 

J \ v\>v 

产生的.利用记号的变换 0{ dy } = y 2 F { dj /}/ m 2 和 om 2 = c , 上式化为 (4.3). 反之， 
如果 n 是集中在 M > 0上的一个概率分布，那么 (4.3) 可以改写为 (4.6) 的形式， 
因此这样的 U 产生一个复合泊松半群，它的分布 Q t 的期望为0,方差为 m 2 t = ct . 
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我们现在可以给出基本的： 

定理设弘的期望为0,方差为那么卷积半鮮 ( Q ( t )} 有形如 (4.3) 的生成元 
IX ,其中是一个正常概牟分布.表达式 (4.3) 是唯一的.反之，每个这种形式的舁 
子产生一个由期望为0,方差为 rf 的分布构成的卷积半群. 

证我们已经证明了形如 (4.3) 的生成元的存在性，但只证明了 的总质童 w < 1. 
剩下的还需证明，如果 n 的质童为 w , 那么形如 (4.3) 的算子 U 产生一个这样的半 
群，使得 Qt 的期望为0, 方差彡 cwt . 

设心是由 (4.3) 通过从积分区域中删去区间0 < | y | < 后所得到的算子.用 
m 和分别表示 n 賦予原点和 M > r ? 的 质董. 由上例推出，叫是两个算子之 
和，其中第1个算子产生一个方差为 cm < 的正态半群，第2个算子产生一个方差 
为_ 的复合泊松半群.根据 9.2 节例 （ c ) 的加法法则，算子叫本身产生一个方 
差为 c(m + 的半群.作为 ij 0 时叫的极限，算子 il 本身是一个半群的生成 

元.对应分布的方差位于对 应于叫 的方差 c{m + w v )t 与它们的极限 curt 之间.这 
就证明了 U 确实产生一个方差为的半群. ► 

9.5 主要定理 

在本节中， {0(0} 表示一个任意的连续卷积半群，对应的分布函数仍用 Q t 表 
示.从 （4.1) 类推，我们用 


n t {dy} = t~ x y 2 Q t {Ay) (5.1) 

定义一个新测度新的特点是，在不存在二阶矩的情况下，测度在全 
直线上未必是有 限的. 但是，对于每个有限区间 IMI ) 是有限的.此外，因为 
Ot{di/} = ty- 2 Q t {dy}, 所以 jT 2 在不包含原点的一个邻域的任一区域上是关于 
可 积的. 我们将看到，当 t — 0时，测度将收敛于一个具有类似性质的测度 S 2, 
这个 fi 将确定一个半群的生 成元. 因此，为方便起见，引入下列的 
定义称实直线上的一个測度 n 为标准的，如果对于有 fft 区间 j , ji {/}< oo , 并且 
对于每个 a :, 积分 

^ + {x) = J y -2 fi{di/},^ -1 (-a:) = J y~ 2 il{dy} (5.2) 


收敛. 

(为了确定起见，我们把积分区间取为闭的 .） 

我们着手证明，除了我们必须讨论标准测度而不是概率分布，和在期望不存在 
的情形下我们应当利用人为的定中心外，上节的理论可以照搬过来_我们把截尾函 



266 第 9 幸无穷可分分布与半群 


数 T ， 定义为这样的连续单调函数，使得 


r •⑻ 



x , 

±«, 


当 M < s 时, 
当|*| > * 时， 


(5.3) 


其中《>0是任意固定的. 

与 (4.2) 类似，我们现在有等式 

午咖)-/_+:- 二 j 卜，卜伽气 W + M'M, (5.4) 

其中 

bt = f T t (y)y~ 2 ilt{Ay} = t -1 f r 4 (y)Q ( {di/}. (5.5) 

J—oo J—oo 

(5.4) 中的被积函数（对于固定的 aO 也是一个在原点取值 \ u "( x ) 的有界连续函数. 
注意，截尾函数的特殊选择 (5.3) 是不重 要的： 我们可以把 t 选择为任一有界连续 
函数，只要它在原点附近是2次连续可微的，并且 t (0) = r ^0) = 0，？⑼= 1. 

我们现在有一个与上节类似的体系，我们来推导类似的 定理. 把仏换为任一 
标准测度， (5.4) 中的积分仍有意义，我们用 

^Mx) = f_2 中 - 以咖 , ㈤ 叫办 } (5.6) 


定义一个算子 iiW . 上标 t 表示对截尾函数 r 的依赖性 . r , 的一个变换(或定义 (5.3) 
中点 s 的一个变换）相当于把项 M/di 加到上，因此算子 


U = U (T) + M/dx (5.7) 

所成的族与 r , 的选择无关. 

定理1 每个连续卷积半群{❶⑷}都有一个生成元 沐11 具有由 （5.6) 〜 (5.7) 确定 
的形式，其中0是一个标准測度. 

反之，每个这种形式的算子 U 产生一个连续的卷积半群 { Q ( t )}. 測度是唯 
一的，且当 t — 0 时，对于有限区间① J , 

n t { J } - (5.8) 

对于 a ; > 0, 

矿⑻， t - x Q ,(- x ) ^ ip ~\- x ). (5.9) 

® 在这里以及今后，我们只对连续的区间和连续点要求收敢. 
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证目前我们沿用 9.1 节的记号.对于每个 n ， 我们考虑 n 个具有共同分布 Q 1/n 
的相互独立的变量之和 S „ = X lin + ..- + X „, n . 于是 S „ 的分布为 Qh 因此 S „ 是 
随机有界的 （8.2 节的定义 2). 我们现在提前使用 9.7 节的引理 1. 据此引理，这蕴 
含对于每个有限区间诸测度 n 1/ n { I } 是有界的，并且对于毎个 e > 0,有一个相 
应的数 a >0, 使得对于所有的 ri , 

«[1 - Qi / n ⑷ + Qi / n (- a)l < e . (5.10) 

(这个引理是十分简单的，之所以推迟它的证明，是为了不中断论证 .） 

根据选择定理，存在一个测度和一列整数叫，使得当广 1 跑遍时，对 
于有限的区间，于是积分 

收敛于定义 ii ( r ) 的积分乂 中 -yj - u M .-_ rj ( v )^) n{dy} . 记住 y 2 n t 

{ dj /} = 由 (5.10) 可以看出，如果把 a 选得充分大，那么积分 

f U(a ： - y) - u(x)~ T“y)u’(g) n ‘.. 和 f u(x -y)- u(x) - t b ( V )u'(x) ^ 

J \ y\>a 1/2 >/|y|>i» I/* 

{ dl /} 可以一致 地小. 我们断言， n 是一个标准测度，当 t - 1 跑遍 { n *} 时， (5.4) 
中的积分一致地收敛于 (5.6) 中的积分.此外，在目前的条件下， (5.5) 中的董是 
有界的，因此不失一般性，可设序列 { n t } 是这样选择的，以致于当卜跑遍卜} 
时， bt 收敛于一个数 b . 于是当 t - 1 跑遍 { n fc } 时， 


r 1 [ Q ⑷- l ] u (*) -» Uu (®), (5.11) 

这里的收敛是一致的.根据 9.3 节的引理3,这意味着半群 { QW } 是由 IX 产生的， 
因此当*以任意的方式趋于0时 (5.11) 都成立. 

因此，我们证明了生成元 U 存在，且可以借助于标准测度0以 （5.6) 〜 (5.7) 的 
形式 表示. 正如在上节中那样，这个表达式中0的唯一性可由下列事实推出，对于 
形如 (4.4) 的函数，值 Uu ⑼由 (4.5) 给出（其中 C 现在被吸收到0中了). 

n 的唯一性里含，当 t 以任意的方式逼近于0时 (5.8) 都 成立.此外， （5.10) 保 
证，对于充分大的 a ：, (5.9) 中的貴一致地小.这些量由 (5.2) 和把换成 A 的类似 
关系式所 确定. 这就证明了 （5.9) 是 (5.8) 的一个推论 • 

还需要证明的是：测度 n 可以任意 选择. 证明和有限方差的情形一样.与在 
9.4 节例 （ b ) 中一样，可以看出，如果集中在 | y | > »/ > 0上，那么 （5.6) 和 (5.7) 
的算子 il 产生一个带有修改了的中心常数（但不具有有限方差）的复合泊松半群. 
于是 U 同样可以表示为生成元的极限，因而是生成元. ► 
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例柯西半群具有密度 + X 2 )- 1 的分布 Q t 构成一个半群.容易验证， (5.9) 
中的极限由 rl > + ( x ) = = jut 1 给出 ，： 与勒贝格测度或普通的长度重合. ► 

下述定理概括了无穷可分分布的各种重要特征 .( v ) 部分的证明放在 9.7 节.(对 
于另一种直接证明，见习题 11) 这一部分可以向具有可变分布的三角形阵列作进一 
步的推广.（见 9.9 节.整个理论将在第17章中讨论 .） 关于这个理论的历史，见 6.3 
节. 

定理2 下列的概率分布类是恒 等的： 

( i ) 无穷可分分布； 

( u ) 与连续卷积半群有关的分布（即平穗独立增量过程中增量的分 布)； 

( Hi ) 复合泊松分布序列的极限； 

( iv ) 无穷可分分布序列的 极限； 

( v ) 三角形阵列 { X fc , n } 中行和的极限分布，其中阵列的第 n 行的变量是同分 

布的. ' 

证设 { Q ( t )} 是一个连续卷积半群.在 9.2 节例 （ a ) 中巳证明，对于固定的 h > 0, 
箅子也 = [ Q ( h )- l]/h 产生一个由算子 Q h ⑴组成的复合泊松半群.当 — 0时， 
生成元收敛干生成元 il , 因此根据 9.3 节的引理 2, Qh ( t ) -* Q ( t ). 于是， Q t 是 
复合泊松分布的极限，从而类⑼包含在类 （ Ui ) 中•类 （ iii ) 显然包含在类 （ iv ) 中. 

对于毎个 n , 设是一个无穷可分 分布. 根据定义，是 n 个独立同分 
布的随机变 M 之和的分布，由此可见序列产生一个 （ v ) 中所述的三角形阵 
列.于是类 （ iv ) 包含在类 （ v ) 中.在 9.7 节中将证明类 （ v ) 包含在类⑻中，因此类 
( H )~( v ) 是恒等的.最后，所有无穷可分分布组成的类是类 （ iv ) 的一个子类，且包 
含 类⑼. ► 

按照这一定理，毎个无穷可分分布 F 作为一个适当的卷积半群的分布出现.借 
助于 < 轴上尺度的适当改变，参数《的值可以任意地固定.但是只存在一个半群 
{ Q ( t )}， 使得无穷可分分布 F 属于它•这相当于说，作为 F 的 n 重卷积的表达式 
P = 是唯一的.这个断言似乎是正确的，但是需要证明.事实上，在它的傅里 

叶理论形式中，唯一性是显然的，而在目前的情况下，证明它将会使我们偏离主题， 
而且也没有什么启发性.因此，我们就不在这里证明这个结论了. 

在随机过程中的应用设 X ( t ) 是一个平德独立增量过程 （6.4 节）的变量，我们把 
Qt 看作 是增董 A-(t + s )- X ( s ) 的分布.考虑具有单位长度的时间区间 i ^ TT , 并 
用点 


« = So <«1 <•••<«« = « + 1 

把它分成 n 个长度为 n - 1 的子区间.那么 P { X ( a t ) - X ( 办 _直）> x } = 1 - Qi , n ( x )， 
因此 n[l - Qi ,„( x )] 等于具 有增贵 > a ； 的区间 8 kZ \, Sk 的平均个数.当 n - oo 时, 
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这个平均个数趋于於 +( x ). 为了使讨论简单起见，假设对所有的极限 X ( f +) 和 
乂 ( t -) 都存在，并且 X ( t ) 位于这两个极限之间.设 3 SZT 7 U 是我们的划分中包含 
故 t 的区间.对于充分大的 n ， 增域 Xis^-Xiak-t) 将接近于跳跃 X(t+)-X(t-). 
在直观上很明显，极限於 + (： r ) 表示在单位时间内使 X ( t +) - X ( t ~) > x 的时刻 * 的 
平均个數.这个结论可以严格证明，但我们将不进行仔细的 讨论. 由这个结果推出， 
只有对所有的 I > 0,都有 V > + (®) = 0和 rP ~( x ) = 0,间断的平均次数才为 0. 在这 
种情 形下， Q 集 中在原点上， 即增董 X(t + s)- X(a) 眼从正态分布.对于这样的过 
程，轨道是以概率1连续的（列维-维纳定理)，因此，轨道是以概牟1連续的，当 
且仅当过程是正态的. 

作为第2个例子，考虑复合泊松过程 (2.8). 单位时间内的平均跳跃次数是 a , 
跳跃度> * > 0 的概率是 1 - F(x). 因此， £*[1 - F(x)] 是跳跃度> a: 的跳跃的平均 
数，这与我们的直观论证完全一致. 


不连续半群 * 

自然要问，是否存在不连续的半群.这个问埋 没有什么实际 意义，但是答案却有一定 
的价值，每个卷积半群 ( Q ( t )} 仅与某_连蛾半群 { Q # ( t )} 在中心常數上有所不同.特别， 
如 果分亊 <3, 是对称的，那么此半鮮一定是连蠄的 •在一般情形下，存在这样一个函数％使 
得由 Q,(.x + < p ( t )) 定义的分布 Qf 与一个连飧半群对应.函败 #显然应满足 

< fi(t + a ) = v >( t ) + 屮 ( a ). (5.12) 

这是著名的哈梅尔方程，它的唯一连续解具有 ct 的形式（见 9.4 节的脚注 1). 事实上，满足 
(5.12) 的唯一的贝尔函数是线性的.其他的解确实非常 奇特； 例如，一个非线性解在每个区 
间上可以取任意大和任意小的值，不可能用分析的方法通过极限过程来表示它.简单地说， 
应该问在怎样的意义上它才•存在 •. 

回过头来，考虑任一卷积半群{口⑴}和与分布 Q 1/ n 有关的三角形阵列 { x k , n inm 
Sn 有共同的分布因此我们可以利用上面最后一个引理来选出一个序列^，叱…，使 
得当 n 跑遍这个序列时， n [ Q ( l / n ) - — ii #, 其中 II * 是一个连续半群 { Q #( t )> 的生成 

元. 我们可以选择形如2«的 n *. 不等式 (3.2) 说明，对于任意大的 Jfc , 在所有的 t 是 i / n k 
的倍数时，即对于所有形如 t = a 2_ v 的 t (其中 a 和 d 是整数)， Q ( t ) = Q * ⑴.因此，总存 
在一个连蛾半鮮 { Q # ( t )}, 使得对于一个稠密集合 E 中的所有的 t,QW = Q * ⑴. 

我们现在可以证明最初的命 题了. 选取这样的 h > 0,使得 t + e „ 在 E 中，那么， 

Q # (t + e „) = Q(t + «„)= £ J ( t ) Q (« n ). (5.13) 

当 — 0时,左边趋于⑴.因此只需证明，如果 Q ( e „) - 5,那么分布 F 集中在一个点 
上•在 E 中选择这样的点 An ,使得0 < c „ < h 且 — 0. 那么= £!(/*„-« n ) Q ( e „). 
左边趋于恒等算子，因此 F 确实只可能有一个增点. 

* 有星号的诸节对理解下文是不 !*» 的，初读时可略去.——译者注 
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9.6 例： 稳定半群 

称半群 {£!(*)} 是稳定的，如果它的分布具有形式 

Qt ( x ) = G (\ t ( x - Pt )), (6.1) 

其中 A t > 0和 A 是两个连续地依赖于 f 的常数， G 是一个固定的分布.显然 ， G 
是 6.1 节中定义的稳定 分布. 稳定半群理论在此处主要是作为上节结果的具体说明 
并记录下它们的生成元的形式而给出的•在9_8节中，将用间接的方法独立地导出 
本节的结果. 

由于假设 A t 和 A 的连续性，知此半群（如果存在的话)是连续的.当 f 0时， 
分布 Q t 趋于集中在原点上的分布，因此 A t — oo . A - 0.(5.14)中第一个关系式呈 
如下形式： 

- G{\ t (x - A ))] - V + (*), *>0. (6.2) 

因为 A — 0, G 是单调的，所以上述关系式在去掉 A 时也成立，于是 (6.2) 可以改 
写成 

1 - ―+⑻. （ 6 . 3 ) 

(这里假设1 是少 +的连续点，这可以通过改变尺度来达到 .） 这里 (6.3) 式是定义正 
则变化的 8.1 节 (8.1) 关系式的一个特殊 情形. 我们断言，或者分 + 恒等于0,或者 
尾部1 _ G 在无穷远处是正则变化的，且 

V » + (*) = c + i -°, x >0, c +>0. (6.4) 

因此，在正半轴上，测度 n 有密度 ac + ar **- 1 . 因为 n 对原点的有限邻域賦予有限 
质量，所以0 < a < 2,并且当 I -* oo 时， <(*)—0. 同理，或者岭-恒等于0, 
或者对于 a : < 0,矿⑷= c - l | x | a . 对于两个尾部，指数 a 是相同的，因为尾部的和 
1 - G ( x ) + G (- x ) 也是正则变化的. 

函数岭+和於- 1 确定了测度 n (在原点上可能有不同的原子).我们将会看到， 
这样的原子不可能存在，除非於+ 和岭- 都恒等于0,且集中在原点上. 

生成元由 (5.7) 给出.在目前的情形下，把它改写成下列形式是方便的， 

U = C + U + + c - il - + bd / dx , (6.5) 

其中算子 u + 和 ir 表示两个半轴的贡献，其定义如下. 

如果 0< a < l , 那么 

Uju ( x ) = ^ [ u ( a : - y ) - u ( z )】 iT 0_1 dy . (6.6) 
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如果1 < a < 2,那么 

U +«(®) = jf [ u(i - y )- u { x ) - yu ' ix ^ y -^ dy . (6.7) 

最后，如果 a = 1, 那么 

= / [ u(i -1/) - «( x ) - T ,( y ) u '( x )] y ~ 2 dy . (6.8) 

Jo 

ii - 用在 =557 上的类似积分来定义，只是要把上述的 y - 0 - 1 换为 M _ a - M 6.6) 和 
(6.7) 中的中心常数与标准形式 (5.6) 中的中心常数不同，但是其差被并入 （6.5) 的 
项 bd / dx 中了 . ft 在原点上的一个原子将使得生成元 U 增加一项 rd 2 / dx 2 . 在 9.4 节 
例 （ a ) 巳证明，这个项本身产生一个正态分布半群. 

定理 （ a ) 当 b = 0,0< a<l 或 l < a <2 时，算子 （6.5) 产生一个如下形式的严 
格稔定 半群： 

Qt { x ) = G ( xt - l ' a \, (6.9) 

当 a = l，b = 0 时，它产生一个下列形式的稳定 半辟： 

Qt ( x ) = G ( xt~ l - ( c + - c ~) hit ). (6.10) 

( b ) 穗定半群或者是甶 (6.5) 产生的半群，或者是一个正态分布半群. 

[在 9.2 节例 （ b ) 中我们巳看到， bd/dx 产生一个平移半群，而且为了得到由 
(6.5)( 其中6 / 0) 产生的半群，只要在 （6.9) 和 (6.10) 中把 cr 换成 ； r + fit 就行了 •] 

证 ( a ) 尺度的一个改变将把半群的分布 (? t 变成由 Qf { x ) = Q t ( x / p ) 定义的分布. 
这些分布构成一个新的半群如果我们设 «(*) = u (^), 那么由卷积定义 
可知 Q *( t ) u { x ) = Q ( t ) v ( x / p ). 对于生成元来说，这意味着，为了求出 iX # ti ⑻，我 
们只需计算 Uv ( i ) 并把 a : 换 z / p •在 （6.7) 和 (6.8) 中利用代换 y = 可知，对于 
相应的生成元 ， Ilf = p a ila 因为 p Q ila 显然是半群 { Q ( p a t )} 的生成元，因此由生 
成元的唯一性，我们知道 <3 t (： c / p ) = O t paOr ). 令我们就可得到 

(6.9) . 

类似的论证在 a = 1的情形下也适用，所不同的是，当在 (6.8) 中使用代换 
y = z //) 时，中心函数产生一个形如 ( c + - 的附加项，这就导致 

( 6 . 10 ) . 

( b ) 对于集中在原点上的测度 n , 有一个相应的正态半群.我们巳看到，任意 
其他的稳定半群的生成元具有 Ua + id 2 /*!^ 的形式.正如 9.2 节例 （ c ) 所说明的那 
样，相应的半群的分布是我们的稳定分布弘与方差为 27 * 的正态分布的卷积，显 
然这样的半群不可能是稳定的. ► 
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此定理断言，在稳定半群的定义中出现的函数 A t 具有 A t = 的形式.考 

虑 （6.2) 以及它在负半轴上的类似表达式，我们得到 

系 如果 0<a< 2 , c+ >0, <r 彡0( 但 c+ + <r >0), 那么恰好存在一个穗定分布 
函數 G, 使得当 a:-oo 时， 

ar 0 [l-G ㈤卜 c+, x a G(-x) - c". (6.11) 

正态分布是唯一刹下的穗定分布[并且满足带有 a = 2 和 c+ = c_=0 的 (6.11)]. 
括号内的断言将在 9.8 节中证明. 

9.7 具有同分布的三角形阵列 

对于每个 n, 设 -,X n , n 是具有共同分布 J^ n 的相互独立的随机变董.我 
们感兴趣的是和 s n =x lin + ...+x n , n 的可能的极限分布，但是先研究极限分布存 
在的必要条件，即先研究序列 {S„} 是随 机有界的这 个要求将是有益的.我们从 8.2 
节中知道，称{5„}是随机有界的，如果对于每个 e > 0,都存在一个 a, 使得对于 
所有的 n,P{|S„| > a} < 6. 粗略地说，即没有质址流到无穷远处去.显然，这是正 
常分布存在的必要条件. 

我们将多次地利用截尾. 最 方便的是再一次利用 (5.3) 中引入的截尾函数7^, 
以便避免不连续性，是一个这样的连续单调函数，使得当㈣< s 时， t.(x) = X; 
当 W 彡 《时， t.(x) = ±s. 对于这个截尾函数，我们令 

X,le,n = T*(Xfc， n ), Xk,n = •^ ， fc,n + X" k，n. (7.1) 

新变量依赖于参数虽然我们的记号没有强调这 一点. 三角形阵列 {A-Vn} 与三 
角形阵列 {X" k , n } 的行和将用 s'„ 和 s〃„ 表示. 千是 s n = s， n + s\. 变贵 x' k , n 
是有界的，对于它们的期望，我们记 

0n = E(X , fc. n ) (7.2) 

(当然与 A: 无 关). 最后我们引入与 9.5 节的测度类似的测度，即由下式定义 
的测度金„: 

$„{da:} = nx a F„{dx}. (7.3) 

对于有限区间 /,$„{/} 是有限的，但是整个直线可能有无穷的质童. 

似乎应该有 | {5„}不可能是随机有界的，除非各个分童在下述意义上变得很 
小> 对于每个 e > 0, 

Ptl-X'fc.nl > e} 0,n -» oo. (7.4) 
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(左边与 fc 无关)具有这种性质的阵列称为零阵列.我们将看到，只有零阵列可以有 
随机有界的行和，但是现在我们引入 (7.4) 作为初始的假设. 

下列引理的“必要性”部分曾被用于 9.5 节定理1的证明中.在那里，条件 (7.4) 
是满足的，因为半群是连续的. 

引理（紧性）聿阵列 { X fc , n } 的行和 S „ 是随机有界的，当且仅当 
⑴ 对每个有限区间 /,$„{/} 是有 界的； 

( ii ) 对于较大的 a :, 見部之和 

T n (*) = n [ l - F „( a :) + F „(- a :)] (7.5) 


一致地小. 

换句话说，要求对于每个 e > 0,存在相应的一个 t , 使得对于 * > t , T n ( x )< e . 
(注意，: r „ 是一个减函数 .） 

证在对称分布的特殊情形，条件 （ H ) 的必要性从不等式 

P{|5„| > a} > $(1 - e xp(-r„W)) (7.6) 

可显然看出 I 见 5.5 节 (5.10)]. 对于任意的我们利用熟知的对称化.与氏一样， 
对称化了的变童 •• Sn 也是随机有界的，因此条件 （ ii ) 适用于对称化了的分布的尾 
部 1 * r „. 但是，对于零阵列，很明显，对于毎个> 0,最后有 ° r n ( o ) $= \ T n ( a + s ). 
因此，在任何情形下，条件 （ ii ) 都是必要的. 

假设条件 （ ii ) 是满足的，可以把截尾点《选择得这样大，以致对于所有的 
n , T n ( s ) < 1. 于是 X ' Yn ，" •，:中不为零的项的个数是一个期望与方差都小于 
1的二项随机变量.因此，可以挑选数 W 和 c , 使得以任意接近于1的概率，在诸 
变量 x \ n 中不为0的项数小于 JV , 并且它们都< c . 这就是说，和 S 〃„ 是随机有 
界的.在这些情况下，为使 { S n } 是随机有界的，当且仅当 { S ' n } 是随机有界的. 
还需证明条件⑴是 {^ n } 为随机有界的充要条件. 

设4 = Var (5 n ). 如果 A oo , 那么把 9.1 节例 （ a ) 的中心极限定理应用于 
变量 ( X' k>n - 0 n )/ a n 可得，对于较大的 n 、 S， n 的分布是具有方差 4 — 的渐近 
正态分布.因此，对于任一有限区间同样的论证也适用于子序 
列，并且说明了 { S '„} 不可能是随机有界的，除非 Vbt ( S ，„) 是有界的.但是，在这 
种情形下，切~比雪夫不等式说明 { S ' n ~ n 0„} 是随机有界的.为使 S „ 是随机有界 
的，当且仅当 { n 0 n } 是有 界的. 因为是一个零阵列， 所以队 — 0,因此 n 札 
的有界性蕴含 Vai ( S '„) - E ( S ^). 

于是我们证明了 E ( S ^) 的有界性是 { S ' n } 的随机有界性的必要条件.根据切 
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比雪夫不等式，这个条件也是充分的.但是 

E ( S ^) = + 8 2 T n ( s ), (7.7) 

因此在目前这些条件下，条件 （ i ) 等价于 E (5^) 是有界的这一条件. ► 

{ X k , n } 是一个零阵列这个假设只用于对称化方面，对具有对称分布的阵 
列可以略去.但是， *„{/} 的有界性蕴含= oCn - 1 ). 我们容易从引理推 
出，具有随机有界的行和与对称分布的阵列一定是零阵列.由对称化推出，在一般 
情形下，存在这样的数/!„(例如 X k 、 n 的中位数)，使得 { X k , n - Mn } 是一个零阵列. 
换句话说，适当地规定中心将产生一个零阵列.在这个意义上，只有零阵列才是重 
要的. 

例设 X k , n 服从期望为/3„、方差为 rT 1 的正态分布，那么 S „ - n 凡服从标准正 
态分布.但因为/3„是任意的，所以{5„}未必是随机有界的.这说明了定中心的重 
要性. ► 

为了理论上的目的，可以这样规定阵列的中心，使得对于所有的叫凡= 0,但 
是所导出的准则在具体情况下很难利用.利用任意的定中心方法，准则涉及到非线 
性项，这时准则不 实用. 我们将把这种情形包含在 17.7 节中.这里我们采用折衷的 
方法，我们只要求 

0 2 n = o ( E ( X f2 kin )), n ^ oo . (7.8) 

这个条件似乎对在实际上发生的一切情形都是满足的.总之，它是如此地弱，以致 
于通过适当的定中心就可以满足它，而更严格的要求 A * = 0可能需要复杂的计箅. 
定理设是一个使得 （7.8) 成立的零阵列 • 

为使存在中心常教使得5„-6„的分布趣于一个正常极限，当且仅当存在 
一个标准測度 fi , 使得对于每个有限区阆， 

* n {/} - (7.9) 

且对于 X >0, 

n[l - ^ n ( a：)l -» tlf + ( x ), nF „(- x ) -» ip ~(- x ). (7.10) 

在这种情形下， S n -成 的分布赵于与一个卷积半群有关的分布 Qn 这个卷 
积半群是由下式定义的算子 il 产生的， 

仙⑷=乂： 也上)二， + 咖"⑻ 咖 _ (7.11) 

证我们首先注意到，对于任意的引理的条件⑴和 （ ii ) 是{5„ _ 6„}为随机 
有界的必要条件，其证明与引理的证明是一样的，只是关系式 E ( S f2 n ) ~ Var (^ n ) 
现在是 (7.8) 的一个推论，而以前我们必须从 S '„ 的有界性来推导它. 




其次假设引理的条件满足.根据选择定理，存在一个序列 { n fc }, 使得当 n 跑遍 
{〜} 时， (7.9) 对有限区间成立.对于一个有限区间0 < a < a : < 6,我们有 

n[F n (b) - F n (a、\ = j: y- 2 ^n{dy}, (7.12) 

(7.9) 保证这个量也趋于一个极限.条件⑼使我们确信，只要6充分大， n[l-F n (,b)} 
将小于任意的 e > 0. 由此推出，对于0 < a < 6 < 00, (7.12) 中的积分收敛于关于 
n 的类似积分.因此 n 是一个标准测度，当 n 跑遍{叫}时， (7.10) 是正确的. 

我们知道， (7.11) 的算子11定义了一个卷积算子半群 { Q ( t )>. 令 e 是由 x k>n - 
0n 的分布 G „ 即 G „0 c ) = F n (x + 0n) 导出的 算子. 在第1节中已证明- n k 0 nh 
的分布趋于与 0(1) 有关的分布因此只需证明当 n 跑遍 { n *} 时， 

n [ Q „ -1 ]-U (7.13) 

就行了.现在 

n [€„ - l ] u ( i ) = ny [ u (® + 0 n -y)~ u{x - y )] F „{ dy }. (7.14) 

我们利用含二阶项的泰勒公式来表示 U(;r + -!/) .因为九 - 0,所以由 （7.8) 和 

^ n {/} 的有界性推出 n 虎 — 0. 又因为 tx 〃 是有界的，所以 


n[in - l ]«( x ) 

=/ [«(* -y)~ «(*) + + e n ( i ), 


其中是一个一致地趋于0的董.这个积分可以改写成 (7.11) 的形式，除了积分是 
关于 fl „ 而不是关于0的以外.正如反复指出的那样，极限关系式 （7.9) 〜 (7.10) 蕖 
含 (7.15) 中的积分收敛于 (7.11) 中的积分，因此当 n 跑遍 { ru } 时 (7.13) 成立.最 
后, 包含 Qi 的半群的唯一性说明，我们的极限关系式对于任意的逼近方式 n — do 
都成立，这就完成了证明. ► 


9.8 吸引域 

在本节中， A ， X 2 是具有共同分布 F 的独立变童.根据 6.1 节的定义2,称分布 
F 属于 G 的吸引城，如果存在这样的常数 a „ > 0和6„，使得 a - 1 ^ + ■••+ X„)-& n 
的分布趋于 G , 其中 G 是一个不集中于一点上的正常 分布. 尽管有 6.1 节和 9.6 节 
中的初步结果，我们还是从头开始叙述这个理论.(在 17.5 节中，我们将独立地更详 
细地叙述这个理论 •） 
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在本节中，我们利用记号 

U ( x ) = 


j / 2 F { dy }, i > 0. 


( 8 . 1 ) 


由 8.8 节中的正则变化的理论知道，称定义在0^上的正函数 i 在无穷远处是缓 
慢变化的.如果对于 z >0, 

L { ax ) 

丽 ― 1 ’ 8 — °°. 


(8-2) 


定理1 分布 F 属于某个分布 G 的吸？ I 城，当且仅当存在一个緩慢变化的尤，使 
得 

U { x ) ~ x 2 ~ a L ( x ), x — » oo , (8.3) 

其中0<£»<2,而且当 a <2时， 

~ F ( x ) F (- x ) 


- F ( x ) + F (- x ) 


1 - F ( ar ) + F (- x ) 


(8.4) 


当 a = 2时，只要 F 不臬中在一点 上®, 条件 (8.3) 是充分的. 

我们将会看到，带有£» = 2的 (8.3) 级含向正态分布的收敛.这包含具有有限 
方差的分布，但是也包含许多具有无界的缓慢变化的1/的分布[见 8.4 节例 （ a )]. 

利用具有 C = 2和 r ? = 0的 8.9 节的定理2,可以看出，关糸式 (8.13) 完全等 
价于 ® 

i 2 [l - F ( x ) + F (-*)] 2 -a 

U { x ) '~ a ~' 

这意味着 （8.3) 和 (8.5) 相互籩含. 

当0 < a < 2时，我们可以把 (8.5) 改写成形式 


(8-5) 


- F ( a :) + F (- x )- 


- x ~ a L { x ). 


( 8 . 6 ) 


® 对于方楚有限的分布，除 F 集中于®点的情形外，1/是缓慢变化的.在所有其他的情况下，如*把 
F (! r ) 换成尸(* +的.那么 （8.3) 和 (8.4) 保持不变 • 

® 条件 (8.4) 对于每个尾部分别*求类似的关系式 

* a [ l - F (*)] 2 -a x a F {- x ) 2 -a , 、 

~~uw) (*) 

当 = 2 时，这些关系式可由 (8.5) 推出. (8.5) 说明•当《 = 2时为什么不需要其他的条件.定 
理1可更 简要地 （但更不自然地）叙述如下， f 厲于某一®引域，当且仅当对于0 < a 矣 2, p 彡 
( U 彡 0, j > + g = 1,(*) 是正鶚的. 
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反之， (8.6) 菹含 （8.3) 和 (8.5). 这导致我们重新叙述这个定理，由于它描述了各个 
尾部的性质，所以它更直观 .( 关于此定理的另外的叙述方法，见习题 17.) 

定理 la (定理1的另一种形式 )•（ i ) 分布 F 属于正态分布的吸引城，当且仅当 f / 
是缓慢变化的. 

( ii ) 它属于某个其他的吸引域，当且仅当（8_6)和 (8.4) 对于某个0 < £» < 2成 
立. 

证我们把 9.7 节的定理应用于服从分布 F n {x) = F{a„x) 的变董 X k ，„ = X k /a n 
的阵列.阵列 {X k , n } 的行和为 

S n = {X 1 + --- + X n )/a n . 

显然 a „ — 00,因此 { X fc , n } 是一个零 阵列. 为了证明条件 (7.8) 是满足的，我们设 
«(*) = J yF{dy}, (8.7) 

并注意到，如果 

I ) 2 (3；) = 0(17(0：))， (8.8) 

那么 (7.8) 一定成立.于是如果当 ： r — oo 时 U(x) -* oo , 那么显然 《( a :) = 
o(xU{x)),U(x) = o(x-^), 因此 （8.8) 成立 • 1/是有界函数的情形是不重要的，因为 
我们知道中心极限定理可用于方差有限的变 M . 但是即使对于有界函数只要这 
样规定 F 的中心，使得它的期望为0,则 (8.8) 是成立的. 

上一定理的条件⑴要求①，对于 a : > 0, 

na~ 2 U(onx) -* n-* oo, (8.9) 

而⑼化成 

n【l - F ( a „ i )] -♦ x/) + (x),nF(-a n x) V '(-*) (8.10) 

味于记号，见 (5.2)]. 容易看出®， an^/c^ - 1. 因此，根据 8.8 节的引理3,由 
(8.9) 推出1/是正则变化的，右极限与 * 的某次幂成正比.按照 P . 列维的记法，我 
们用2 - 表示这个幂.因此 

n{-x,i} = Ci 2_a , i > o. (8.11) 

® 照例我 们只对连续点 》 求收敢 性. 

® 对于对称分布， 这可由下列亊实推出 I (^ +…+ ^)/^和 (Xi + --. + X „)/ o „ +1 有相同的 
极限 分布.对于任*的 断言可由 对称化 推出. 
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右边是 a ： 的一个不减函数，在原点附近是有界的，所以我们有0 < a < 2. 由此推 
出 C / 确实具有 (8.3) 所断言的形式. 

此外， 8.8 节的引理3使我们确信， (8.10) 中的极限或者恒等于0,或者与 z 的 
某次幂成正比. (8.5) 指出唯一可能的幂是 I -' 事实上，当 a = 2时，两个极限都 
恒等于0,而对于 a <2,极限一定具有和 Bx~ Q 的形式，其中4 > 0 ,S > 0, 
但 4 + S >0. 由此推出，定理的条件是必要的. 

假设 （8.3) 是正确的，那么可以构成这样一个序列 {0 „},使得 

rui- 2 U(an) — 1 . ( 8 . 12 ) 

例如，我们可以取 a „ 为所有使得⑷< 1的 f 的下界.于是 （8.3) 保证，对于 

I > 0, 

na~ 2 U{Onx) —* x 2- ®. (8.13) 

因此，条件 (7.9) 对于形如 J = {=x^) 的区间是满足的.在 a = 2的情形下，极限 
测度集中在原点上，因此对于所有有限区间， （7.9) 是满足的•在这种情形下，由 
(8.5) 推出，条件 (7.10) 对于恒等于0的分+和 V >- 也是满 足的. 当 a < 2时，关系 
式 (8.3) ~ (8.5) 31 含，当 * -» oo 时 

1 - F ( z ) ~ p^^-x- a L(x), F{-x) ~ q^~x~ a L(-x), (8.14) 

只要 p > 0,« > 0_(在相反的情形下， 符号〜 应换为••小没有什么本质上的变 
化）由此推出，条件 (7.10) 成立，这又癟含 (7.9) 适用于任意一个到原点有一个正 
距离的区间. ► 

值得注意的是， 9.7 节的所有结果都逭含在本定理及其证明中.这个证明还可 
导致其他有价值的结果.首先我们有明 显的： 

系如果 a = 2,那么极限分布是正态的，否則它是渦足 (6.11) 的稔定分布.在任 
何情形下，它都是确定的（涂尺度麥數可任意变化外). 

我们也已看出， （8.12) 导致一个可能的正规化因子 a „ 的序列.容易看出，另一 
个序列 {a'n} 是一个正规化因子序列，当且仅当比 a'Jan 趋于一个正极限. 

在定理1的条件下，我们建立了 S n - np n 的极限分布的存在性，其中由 
(8.7) 所确定] 


= E ( X fc , n ) = a ；^ t ;( aa „) + ®[1 - F ( aa „) - F(-sOn)]. (8.15) 

我们现在着手证明一个有趣的 事实： 除了 a = 1的情形外，中心常数 A * 实际上是 
不必要的. 
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当 a < 1 B 寸，我们分别把带有 C = 1和= 0的 8.9 节的定理2应用于两个半 
轴上，可以得到，当 z — oo 时， 

«( z )~ F ( i )- F (-; c )]. (8.16) 

由此式和 (8.10) 推出， n /3„ 趋于一个有穷极限，因而不起什么重要作用. 

当 a > 1时，带有 C = 2和 r ; = 1的节的定理2说明 F 的期望存在，我们 
自然要这样定 F 的中心，使其期望等于 0. 于是在积分 (8.7) 中可以把积分区域换 
成 M > *, 我们已经知道 (8.16) 仍然成立. 因此& 的分布趋于一个极限，这个极 
限的期望也是 0. 类似地，当 a < 1时，极限分布的中心是这样规定的，以致于它 
是严格稳定的.于是我们证明了： 

定理 2 伋设 F 满足定理1的条件.如果 a < 1，那么 ^( anx ) - G{x), 其中 G 
是一个满足 (6.11) 的严格穗定分布.如果 a > 1,只要这样規定 f 的中心，使其期 
望为0,那么也有同样的结论成立. 

(关于 a = 1时的中心常数，见 17.5 节.关于 F 的矩，见习题 16.) 

9.9 可变分布，三级数定理 

我们很简单地叙述一下一般的三角形阵列 {x k ,„}, 其中第《行的变董® X ：, 
是相互独立的，但是有任意的分布 &,„• 为了保持我们的极限定理的特点，我 
们只考虑零阵列 I 要求对于任意的 J />0, C >0 和充分大的 n , 

p { l -^ fc , n | > r /}<£, k = (9.1) 

只要把像 nVar ( X ' fc , n ) 这样的表达式换成相应的和， 9.7 节的理论就可搬过来. 
特别，只有无穷可分分布可以作为零阵列的行和的极限出现•验证可以留给读者作 
为通常的练习题. 

我们来讨论一些有趣的特殊情形.记号与 9.7 节中的一样，但是下面所用的截 
尾类型是无关紧要的，也许最简单的是把截尾变量在 ! X fc , n | < «时定义为 X' k , n = 
X k , nt 否则定义为 X' k , n =0, 此处截尾水平 s 是任意的 • 

第1个定理是紧性引理的一个变形，并且与它等价. 

定理1 (大数定律）设表示一个聿绛列的行和.为使存在这样的常數6„，使 
得® 5„_6„三0,当且仅当对于每个 T ?>0 和每一个截足水平 a , 

E p { l^*.nl >»7}-0. EVar ( X '*,„) — 0. (9.2) 


® 关于第 n 行的变置个数，见 7.13 节的习雇 10. 

® 我们由 8.2 节知道，如果对于毎个 e > 0,P{|Z„| > e> - 0. 那么 Z„ 依概率 收敢于 0. 
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在这种情形下，我们可以取6„ = ^ EpT ' fc ,„). 

作为一个应用，我们来证明如下的在 8.5 节中巳讨论过的定理. 

定理 2 (无穷卷积)设的，妁,…是具有分布 G & G 2, …的独立随机 变量， 和； T „ = 
Vi + --- + r n 的分布 Gx - kG^if - kGr , 趋于一个正常极限分布 G , 当且仅当对于 
每个 s > 0, 

5>{| ig >«}< oo ，^ Var ( y , fc )< oo , (9.3) 

且 

^ E ( r fc )^ m . (9.4) 

fc=i 

证对于给定的一列递增整数巧,…和 * = 1,…, r », 令 X k , n = Y Vn+k . 分布 
Gi ^ …收敛，当且仅当所有这种类型的三角形阵列服从带有中心常数6„ = 0 
的大数 定律. 由定理1,条件 （9.3) 和 （9.4) 显然是这个结论的充要 条件. ► 

定理2可以改述如下 • 

定理 3 (科尔莫戈罗夫“三級數定理 ”•） 如果 （9.3) 和 （9.4) 成立，那么級數 
以概率1收敛，否则級數 J ^ Y k 以概牟0收敛. 

证 假设 （9.3) 和 (9.4) 成立. 根据 7.8 节的定理2, (9.3) 中的第 2个条件保证 
e ^*)] 以概率 1 收敛， 于是 (9.4) 遺 含也 以概率 1 收敛.根据博笛 
尔-坎泰利引理(见第1 卷 8.3 节)， (9.3) 中第 一个条件保证 以概率 1只有有限多个 
U 与不同，因此 Eh 以概率 1 收敛. 

为了证明我们的条件的必要性，我们注意（见 4.6 节）收敛的概率，或者是0, 
或者是 1. 在后一种情形下，部分和的分布必定收敛，因此 （9.3) 和 （9.4) 成立. ► 


具有非平 稳增量 的过程 

本聿的半群理论是讨论平稳独立增世过程的一个 工具. 没有平稳性这个条件，增世 
X ( t )~ X ( r ) 将服从 - 个依赣于两个参数 t 和 r 的分布，我们必须讨论满足卷积方程 

Q ( t , s )0( a , t ) = £3( r , a ), r < a < t , (9.5) 

的算子 Q ( r , t ) (其中 0 < t < t ) 所组成的依赖于两个参数的族.与这些算子对应的分布是 
无穷可分的吗？我们可以把3分成 r » 个区间 trm , 考虑变量 X ( t k ) - Xitk - x ), 但是为 
了应用三角形阵列的理论，我们需要条件 (9.1), 这个条件相当于依糗于两个时间参败的分 
布的一致收敛性_但是 Q ( r , t ) 未必连续地依赖干 t . 亊实上，独立随机变量序列 - 
的部分和表示一个独立增纛过程，其中所有的变化都发生在整数时刻，因此过程基本上是 
不连续的.但是在某种意义上，这是唯一的本质上不连续的类型.形容词“本质上”是很重 
要的，因为在 9.5 节中巳证明过，即使对于普通的半群，人为的定中心也可能产生 损害； 虽 



然这种损害是无关紧要的，但在系统阐述时也需要小心 . 因此，为了简单起见，我们只讨论 
对称分布并证明 

引理如果与 Q ( r , t ) 对应的分布是对称的，那么对于每个 t , 单側极限 Q ( r , t -) 都存在. 

证令 r < ti < < …，并且 t „ - t •与对应的分布序列是随机有界的，因此存 
在一个收敛的子序列.去掉双重的下标，我们可以假设 Q ( r , t „) — 11,其中 U 与一个正常 
分布 U 对应.由此容易推出， 

Q ( tn , t «+ l ) -» 1, 

这癟含对于任一使得 t n < Sn < tn+J 的时刻序列， — 1.由 (9.5), 这意味着 
Q ( T , Sn ) — It , 因此这个极限 U 与序列 { t „} 无关，引理 得证. ► 

仿效 P . 列维的说法，我们称 Q 在 t 点有 一^曲定的不连埃点， 如果两个极限 Q (7", t +) 
和 Q ( T , t -) 不同.由定理 2 容易推出， 固定不连埃点的集合是可敫的 •利用对称化在一般情 
形下也可推出，除了至多可数个时刻外，不连续点只是由于定中心引起的（而且可以通过 
适当的定中心去掉).所有的固定不连续点对 Q ( T , t ) 的贡献是一个无穷卷积，可以 把过程 
分 解成一个离散部分和 一个连 螭部分 .对于由连续过程产生的三角形阵列，利用定理2不难 
着出，一致性条件 (9.1) 显然是满足的，我们得到如下的结论 i 与连縝过程有关的分布是无 
穷 可分的 . P . 列维曾证明，这类过程的样本函败在下述意义上具有良好的性质，即在每个时 
刻 t , 左极限和右极限以概率1存在. 

9.10 习 题 

1. 证明在 9.1 节例⑷中，当 n — oo 时，工 1.( 提示，利用方兹 .） 

2. 在普通的对称随机游动中，设 r 是首次通过+1的时刻.换句话说， r 是一个这样的 

随机变置，使得 ‘ 

P{T = 2 r - l } = i ： ( 2 ； )2' 

考虑一个三角形阵列，其中的和 T / n 2 有相同的 分布. 利用 9.1 节的初等方法， 
由直接计算证明 

♦咖) -♦) 卜去厂 (*) 

证明 | 行和的分布趋于 2.4 节式 （4.7) 中定义的满足 2.4 节式 （4.9) 卷积性质的稳定分 
布.借助于一个随机游动来解释这个结果.在这个随机游动中，步长是 ±\/n, 连续两 
步之间的时间是 1/ n 2 . 

1提示，定义 Snu ( x ) 的级数可以用积分来道近 .i 

3. 对于参败值 a = 1考虑 2.2 节式 (2.2) 中的 r 分布.证明《 2.2 节式 (2.3) 卷积性质21 
含它们形成一个具有生成元 
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的半群.讨论没有定中心项的情形 • 

4. 2.4 节式 (4.7) 的单側稳定分布具有 2.4 节式 (4.9) 卷积性质，从而构成一个半群.证 
明：生成元由习题2中 （*) 的右边给出. 

5. 设半群的分布 Q t , 集中于整数上并用 q k (t) 表示 * 的质量.证明， 

Uu ( a :) = ⑼ u ( z ) + [ g ’ ⑼ tt (* - fc ), 

并与标准形式 (5.9) 比较.根据这个见解来解释在第1卷 12.2 节中得到的无穷可分分 
布的母函数. 

6. 试把9. 2 节的概念推广到具有亏损分布的 半群. 证明，如果 II 产生那么 iX-cl 
产生{6-°*0(*)>. 

7. If 合泊松分布的记号导致我们一般地记 £!(«) = #. 对于正态半群，这导致 
形式上的算子方程 

证明 i 当1/的泰勒级数对所有的 a ： 收敛且上式右边的级败对 * > 0收敛时，上式成 
立.(提示，由《和一个正态分布的卷积的泰勒级数 开始. 利用正态分布的矩 .） 

8. 为使一个半群的分布具有有限期望，当且仅当关于出现在生成元中的测度 n 
是可积的. 

9. 直接证明 I 如果 n [5„ 则算子 IX —定具有生成元的形式•[利用 9.4 节中考虑 

形如 （4.4) 的函数的方法，但不利用半群理论.目的是在还没有证明生成元的存在性 
的愤况下，推导生成元的一般形式 .] 

10•设巧对两点都賦予概率^，则 

T, - 1) 

产生这样的一个半群，使得 Q at (*) = Qt{xn), u Q t 不是稳定的 （ P . 列 维). 

11. (三角 形阵列的行和的极限分布是无穷可分的直接讧明 .） 设{及,„}是具有共同分布的 

变量的三角形阵列 . S „ 的随机有界性蕴含部分和+ + 的随机有界性，其 

中 m 表示< n / r 的最大整数.利用选择定理来证明，这葸含 S „ 的极限分布 G 是一 
个分布的 r 重卷积 CT . 

12. 对于任意的 F 和光滑的 U , 

11(? - 1川 < 10 O (|| u || + j ^ Fldx } + | K ||. 
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13. 对于具有分布的三角形阵列存在一个具有复合泊松分布 

St=^Sn' 

的阵列 {^ n > 与之 对应. 证 明：当 { Sn > 是随机有界时， n [5„ -5 fl — 0. 这表明行和 
S „ 与对 是!漸近等价的 •因 为旬 1 的分布与 el -®"- 1 ' 有关，所以这就得到了推导 9.7 节 
主要定理的第二种方法.这种方法也可应用于具有可变分布的阵列 .（ 提示：利用习题 
12 .) 

14. 利用 9.5 节的记号，令 M „ = max [ Xi ,„,---, X „.„]. 如果 S„ 有一个极限分布，证 
明 I V + (*) = —lim In P { M n < *}. 

15. 如果有极限分布，则由 平方幻 构成的三角形阵列的行和也有极限分布. 

16. (吸51城）设 F 厲于指数为 a 的稳定分布的吸引域.利用 8.9 节的定理2证明^ F 具有 
所有阶数小于《的绝对矩.如果 a < 2,那么阶败大于 a 的矩不存在.在 a = 2时最后 
这个结论不真. 

17. (縝）在8_8节中，理论是以截尾二阶矩函数为基础的，但之所以这样做是因为传统的 
理由 . 8.9 节的定理2允许我们把 （8.1) 中的 j / 2 换成具有另一指数 p 的 | yr 并且对每 
个 P , 把 （8.3) 和 (8.5) 换成等价的关系式. 

18•设 U 2 , …是具有共同分布 F 的独立变量.如果1 - J^O + Fric ) 是缓慢变化的， 
利用紧性引理推导，除了当 G 集中于一点上时以外，序列 S nk /a k + b k 不可能有极限 
分布 G . (这可用 F 不 属于部 分吸引域一语来表示•见 17.9 节 .） 提示，利用对称化. 
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本章从马尔可夫过程的最普通的类型，确切地说，是从其转移概率的基本方程 


的最普通类型的 
念，紧接着我们5 
这些课题的桥梁 


初步研究开始.然后我们讨论波赫纳 （ Bochner ) 的过程的从属的概 
利用半群来讨论马尔可夫过程.所谓的半群理论的指数公式是联结 
梁.生成元的存在性将只在第13章中用预解式理论来证明.在理论 


上，现在的论述可以包含上一章的过程和半群作为特殊情形，但是方法和用途是不 
同的 •这 一章的理论是自给自足的， 且与第 9幸是 独立的 .这些结果将在第13 章中 
进一步阐述，但是在本书的其他课题 中没有用到马尔可夫过程的理论. 

本章主要是概述性质的，既不致力于一般性，也不致力于完整性特别地，我 
们不讨论样本函数的性质，并且在本章中认为过程一定存在.我们的兴趣完全集中 


在转移概率和定义算子的解析性质上. 


在 8.8 节和 8.9 节中我们将较一般地论述变换的导出半群的 理论. 在前面的各 
节中，基本空间是直线上的区间或整个直线，尽管部分理论可适用于一般的空间. 
为了避免引入专门的记号，我们约定，当不写出积分限的时候， 积分 是在一 个作为 
基本空间的固定集合12上进行的. 


10.1 伪泊松型 


本章，我们的讨论局限于具有如下定义的平穗转 移概芈 Q t 的马尔可夫过程, 


Qt(x,r) = P { X(t + r )€ r | A -( r ) = *}, (1.1) 


其中 Qt 与 t 无关•（见 6.11 节 .） 

复合泊松过程的简单推广可导致这样一类重要的过程，使得所有其他过程都 
可用此类过程来逼近.半群理论依赖于这种情况的分析对应物 （10.10 节) • 

设 N{t) 表示普通泊松过程的变童.在 6.4 节中，复合泊松过程是通过考虑随 
机和 S N{t) 而引入的，其中，…是独立同分布随机变擞序列的部分和.伪泊松 
过程是以同样的方式定义的，只是现在5 0 ,负， ••是 具有以随机核给出的转移 


①邓# ( DynkinKigM ) 和洛埃韦 （1963) 更详细地论述了马尔可夫过程的半群理论 . Yosida (1966) 
包含半群的解析理论及其在扩*和遍历運论中的应用的简要介绍. 



概率的马尔可夫链的变董（见 6.11 节).变 M 义⑴= S N(t) 定义了一个新的随机过 
程，它在形式上可叙述如下. 

在泊松过程的诸跳跃之间，典型的样本轨道保持不变.从: c 向 r 的转移可以 
通过0，1，2,. ••步 来实现，因此 

Q t ( x , r ) = e - at Y i ^- K ^ n \ x , r ), t >0. (1.2) 

这就推广了 6.4 节 (4.2) 复合泊松分布，并且当是全直线，是 r » 个具有共同 
分布 F 的独立随机变量之和的时候，上式就化为泊松 分布. 

与 6.4 节 (4.1) 类似的合成法则 

Q t + r ( x , r ) = J Q t ( x , dy ) Q r ( y , r ), t , T >0, (1.3) 

很容易用分析方法加以验证 .® 它称为查普曼- 科尔莫戈罗夫 方程，说明从时刻0 
的: r 向时刻 f + 7■的尸转移是通过时刻 t 的 y 后发生的，而且后来的变化与过去 
独立 .® [见第1卷 17.9 节，又见 6.11 节 (11.3).] 

例 （ a ) 碰撞情死下的质点. 设质点以匀速在均匀物质中运动，有时发生碰撞.每 
次碰撞产生一个由随机核 A ： 所控制的能量变化.如果碰撞次数服从一个泊松过程， 
那么能埴 X ( t ) 的转移概率具有 (1.2) 的形式.在我们已经熟悉的关于空间的齐次 
性和缺乏记忆性的假设下，情况确是这样的. 

通常假设在每次碰撞后所损失的能童与原来的能量之比是与初始能童无关的， 
这就是说， K ( x , dy ) = V { d V / a :}, 其中 V 是一个集中在 D 上的概率分布.为了以 
后的应用，我们考虑 V ( x )= x x 这一特殊情形.于是 A ： 的密度为 

Hx , y ) = Xx ~ x y x ~ l , 0 <y < x . (1.4) 

当 A == 1 时，这意味着损失的能鼉与原来的能量之比是均句 分布的 . ® 叠核巳 
在 6.11 节 (11.5) 中计算出来了.代入 (1.2) 可以看出在原点上具有质量为 e- ot 
的原子（说明无碰撞发生的亊件)，对于0 < v < *, 密度 

Qt ( x , y ) = e _ at v / Aot - j ^==== x h (2 y / atX ] n { x / y )), (1.5) 

①用含 n 項的部分和遁近和说明 (1.3) 的右边不大于左边.伹是不小于 Q t + r 的第 r> 个部 
分和. 

® 有时称 (1.3) 是自然 规律或者复合撅率的规律，但是对非马尔可夫过程它是不正碥的.见第1卷 
15.13 节. 

® 这个傾设曾被利用于 W. Heitler and L. Janoesy. Abtorption of meson producing nucleons , 
Proc. Physical Soc., Series A, vol. 62 (1949)pp. 374-385, 其中导出了福克-普朗克方 fi (伹未 
解出). 
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其中 A 是 2.7 节 (7.1) 中定义的贝赛尔函数.[见 10.2 节例⑷和例 （ b ). 】 

例 （ b ) 高速质点电离时损失的 能量，考虑可以有无穷大能童的质点的极端情形， 
就可得到上例的有启发性的变形.这时逐次碰撞时损失的能童是相互独立的随机变 
量，具有一个集中在_上的共同分布 V .如果 X ⑷是在时间区间5^内的总能 
M 损失，那么 A •⑴是一个复合泊松过程的变量.它的转移概率由 （1.2) 给出，只是 
需要把其中的换为卷积 V n *. 

例 （ c ) 方向的变化. 代替质点的能量，我们可以考虑它的运动方向并推导出与例 
( a ) 类似的模型.主要的差别是 R 3 中的方向由两个变童所确定，因此密度核 fc 现 
在依赖于4个实变董. 

例 （ d ) 2.7 节例 （ b ) 的随 机化了的随机游动， 表示一个局限于整数上的伪泊松过 

程.对于固定的整数: r , 核 A " 对于点* = ±1分别賦予质量 1/2. ► 

由 （1.2) 容易推出， 

9Qt< ^ ，r) = n + a I Qt ( x , dz ) K ( z , r ). (1.6) 

这 是科尔莫戈罗夫向前方租， 我们将在 10.3 节中在较一般的背彔下予以讨论.在 
下一节中将证明 (1.2) 是此方程的满足明显的概率要求的唯一解.当 if 有密度 
时，方程 （1.6) 就化为一种更常见的形式.在点 a ： 上，分布 £? t 具有质贵为的 
原子， e - Qt 是不发生变化的 概率； 除了这个原子以外，有一个满足下列方程的 
密度 和 

9<h ^'^ = ~ a 9 t ( x ,0 + a J q t ( x , z ) K ( z ,^) dz . (1.6 a ) 

如果 / io 是在时刻 0 的概率分布，那么在时刻 f 的分布为 

iH { r } = J Mo { di } Q t ( i , r ), (1.7) 

且 (1.6) 蕴含 

= ~ a ^{ r } + Q J r ). ( i .8) 

(1.6) 的这一形式被物理学家称为福克-普朗克方程(或连续方程).我们将在 
10.3 节中分析它的本质.当 / f 和初始分布仲有密度时，内也有密度 m *, 且这时 
福克-普朗克方程化为 

+ a J mt { z ) K ( z ,^) Az . (1.8 a ) 


①下述论文的题目 ■ L. Landau, J. Physics, USSR, vol. 8(1944) pp. 20X-205. 兰道 （Landau) 使 
用了不同的术语，但他的假设和我们的相同，他导出了向前方程 (1.6). 
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10.2 —种变形： 线性增量 

上述过程的一种简单变形经常出现在物理学、排队论和其他应用中.关于跳跃 
的假设与从前相同，但是义⑷在语跳跃之间是以速度滅性地 变化. 这就是说， x ⑷- 
ct 是上述伪泊松过程的 变量； 如果表示此新过程的转移概率，则 Q t ( x,r + ct ) 
一定满足 (1.6). 所得的 Q t 的方程具有不常见的形式，但是如果存在可微的密度， 
则它们满足常见的方程.对于 m «, 我们把 (1.8 a ) 中的 f 换为 f + rt. 利用变量替换 
y = ^ + ct , 我们得到福克-科尔莫戈罗夫方程①： 

dtT ^ V ^ = ~ c ~^ - oirn t ( y ) + a J m t ( z ) k (, z , y ) dz . (2.1) 

( 1 . 6a ) 的类似方程可以通过把项 - cdqt / dy 加到右边而得到. 

与半群理论联系起来，我们将考虑具有更灵活的形式的福克-科尔莫戈罗夫 
方程，此方程是与上面的不自然的可微性条件无关的.丨见 10.10 节例 （ b ).] 

例 （ a ) 碰撞情 形下的 质点. 在物理学的文献中 10.1 节例 （ a ) 通常以一种修正的形 
式出现，其中假定在诸碰撞之间，能最由于吸收或摩擦而以固定的速度消耗.只要 
能量的损耗与 mt 成正比（这里 m * 表示时刻 t 的能董 的概率密度)，则 (2.1) 的模型 
适合于上述情况. 

在其他情形下，物理学家们假设，在各次碰撞之间，能鼉是以与瞬时能童成正 
比的速度消耗的.在这种情形下，能 M 的对数以固定的速度减少，一个形如 （2.1) 的 
方程支配着能童的对数的概率密度. 

例 （ b ) 恒星的輻射 .® 在这个模型中，变 M * 表示距离， X { t ) 表示通过空间的光 
线的强度.假设（在赤道平面内）每个体积单元以固定速度辐射，因此 X ⑷是线性 
增加的.但是空间也包含可以吸收光线的黑云，我们把黑云当作点的泊松总体来对 
待. 每束光线在遇到 黑云时 经受随机性的 损失. 在这种情形下，我们可导出 (2.1). 

①福克科尔典戈罗夫方程 (1.8) 的许多持珠情形巳被独立地发现.推广 (2.1) 被过分地予以注 
意.福克__科尔典戈罗夫方程的一 JR 形式是科尔莫戈罗夫在他的下列著名论文中得剌的 I Uberdie 
analytiachen Methoden in der Wohrache inlichleeitsrechnung , Math. Ann., vol. 104(1931) 
pp. 4Z5-468. 科尔莫戈罗夫在此文中提及了把任*的扩 ft 项 
d^mt dmt 

7 歹 _<； 百 

加 M 右边的可 能性， (2.1) 只是这种可能性的一种特殊情形.即使 ft 初的存在定理也包含非平稳情形 
下的一般方程 ■ [Fteller, Math. Ann., vol. 113(1936).] 

® 这些物理假设取自于 V. A. Ambarzumian, On the brightness fluctuations in the Milky Way , 
Doklady Akad. Nauk SSSR, vol. 44 (1944) pp. 223-226, 在此文中用间搂的方法导出了 (2.1) 
的一种变形. 
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似乎可能的是(这是可以证明的)， X(t) 的密度 mt 趋近于一稳定状态密度 m , 这个 
m 与 i 无关，且满足把左边换为0的 (2.1). 

阿姆巴朱米扬特别假设，在各次通过黑云时的光强度损失由转移核 （1.4) 控制. 
在这种情形下，可得到 (1.5) 的显式解，但是它不是重要的.更重要的（且容易验证） 
是下述 事实： (2.1) 有与时间无关（或稳定状态）的解，即 r 密度 

m ( y )= (^) A+l r ^ T ) yXe ~ (a/C)V ' y>0 - (22) 

这个结果说明即使不求出显式解，也可以从 （2.1) 中得到有关的信息.例如，容易 
用直接积分来验证，稳定状态解的期望为 C [ a(l - M )]- 1 , 其中 m 是吸收分布 V 的 
期望. 

例 （ c > 6.5 节的 破产问 场表示 k 是卷积核这一特殊 情形. 这些过程的变 M 是通过 

把 - ct 加到复合泊松过程的变童上去而得 到的. 可以对任意的伪泊松过程给出类似 
的破产问题，它们导致 (2.1). ► 


10.3 跳跃过程 

在伪泊松过程中，等待下一次跳跃的时间服从固定的指数分布，它的期望为 
l / a . 如果设这个分布依赖于轨道函数 A ■⑷现在的值，就可得到一个自然的推广. 
[在 10.1 节例 （ a ) 中，这相当于假设相碰的概率依輳于质点的能貴 . 1这种过程的马 
尔可夫性要求这个分布是指数分布，但是它的期望可以依赖于 X(t) 现在的值.因 
此，我们从下列基本公设开始. 

基本公设 给定 X ( t ) = ; r , 等待下一次跳跃的时刻服从指数分布，其期望为 
并且与过去的历史独立.下一次跳跃到达尸中的点的概牟等于尸). 

用分析的术语来说，这些公设导致过程的转移概率 Qt(x,D 的积分方程（假 
定这样的过程确实存在).考虑一固定点 a ： 和一个 不包含 a ; 的固定集合 A 亊件 
{X(t) € r} 不可能发生，除非从 a : 出发的第一次跳跃发生于某个时刻/» < * .给定 
这个条件， pf ⑴€ r } 的条件概率可由 K(x,dy)Q t - t (y,n 在所有可能的 y 组成的 
集合上的积分 得出. 现在第一次跳跃的时刻是具有指数密度 a ( x ) e - a (*>» 的随机 
变量.对这个密度积分，我们得到 { A •⑷ e r } 的概率： 

Q t (x,r) = a(x) j: e_ a (*)-d« 乂 K(x,dy)Q t . a {y,r). (3.1a) 

对于包含 a : 的集合 r , 我们必须加上在 t 前不发生跳跃的概率，于是得到 
Qt(x，n = + a(x) J: e - a ^dsJ n K(x,dy)Q t ..(y,r). 


(3.1 b ) 
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这两个方程分别对于 a ： g r 和 a ： e r 成立，它们是基本公设的分析等价物•可 
以用积 分变董 的替换 r = t -8 来简化它们.对 t 微分就可把这两个方程化成同一 
形式，这一对方程可由下列积微分方程来代替 

— = - a ( x ) Q t { x , r ) + a ( x ) - J n K ( x , dy ) Q t ( y , r ). (3.2) 

这是 科尔莫戈罗夫的向后方程， 它是分析描述的出发点， 因为它 避免了区分这 
两种情形这件麻烦亊. 

向后方程 （3.2) 有简单的直观解释，这种解释可以用来以更实用的术语重新叙 
述基本公设.利用差商的术语， (3.2) 等价于 

Qt+h(x, r) = [1 - a(i)h]Q t (x, r) + a { x)h K ( x , dy ) Q t ( y , r ) + o ( h ). (3.3) 

为了 ^ 这个关系式的直观解释，把 在时间区 间 Oj+h 内的变化看作是在初始短 
区间 m 内和后面的长度为 f 的区间 M +1 内变化的 结果. 那么很明显， （3.3) 说 
明，如果 Jf (0) = X ,那么在0内发生一次跳跃的概率是 a ( x )/» + o ( h )； 发生一次 
以上的跳跃的概率是 0 (/»);最后，如果在 M 内确实发生一次那么可能的转 
移的条件概率是 K ( x , dy ). & 3个假设导致 (3.3), 从而导致 (3.2). 实质上，它们重 
复了基本公设 .® 

从概率的观点来看，向后方程有点不自然.因为在其中终止状态 r 起着 参数 
的作用 ,且 (3.2) 描述了 Q t { x , r ) 对初始位置 a : 的依赖性.容易看出，通过把区间 
Oj + h 分裂成一个长初始区间旧和一个短终止区间 ij + h 来推导一个关于 Q t+ h 
的方程是较自然的.这样，代替 （3.3), 我们在形式上得到 

Qt+h(x, r 、= 心 Q t (x, dz)[l - a ( z ) h ] +1 Q t (x, dz ) a ( z ) hK ( z , r ) + o ( h ). (3.4) 

h Qt ( x , dz ) a (, z ) 4 - j Q t ( x , dz ) a ( k z ) K ( z , T). (3.5) 

这 是科尔奠戈罗夫向前方租 (在特殊情形下被物理学家称为连续方程 或福克 _ 
普 朗克方程). 当 a 与2无关时，它化为 (1.6). 

这种推导的形式上的特点之所以被强调，是因为我们的基本公设实际上并不 
蕴含向前 方程. 这是因为 (3.3) 中的项 o (/ i ) 依赖于 z , 又因为是 (3.4) 中的积分变 
- tt , 所以项 o ( ft ) 应出现在积分号 下面. 但是这样就会出现如下的问题 I (3.5) 中的 
积分是否收敛以及取极限 /I — 0是否 合理. [在向后方程中不出现这样的问题，因 
为初始值 re 是固定的，并且由的有界性知道 (3.2) 中的积分是存在的 . 1 

① Q t 关于 t 的可微性和发生一次以上的跳跃的概率是 o(/i) 这个亊实，现在被叙述为一个新的公设， 
它们被 m 来的更复杂的阐述所 a [含. 
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把关于 (3.3) 中误差项的一个适当条件加到我们的基本公设中去，可以证明向 
前方程，但是这样的推导会失去它的直观上的吸引力.此外，提出包含实际中出现 
的所有典型情况的条件似乎是不可能的.如果《是无界函数，那么 (3.5) 中积分的 
存在性就值得怀疑，这个方程就不能预先得到证明.另一方面，向后方程是基本假 
设的必然推论，因此最好用它作为起点来研究向前方程可由向后方程来推导的程 
度. 

利用具有简单概率意义的逐步逼近法容易求出向后方程的一个解.用(*，尸) 
表示一个 至多有 n 次跳 跃的从 X(0) = * 向 X(t) G r 转移的概率.无跳跃的转移只 
有在 a : e 尸时才可能，因为在; r 上的逗留时间服从指数分布，所以我们有 

切 0) (1， 尸) = e-^K^Cx.T) (3.6) 

(其中按照 Z 是不是包含在 r 中， K(°Hx，n 等于1或 0). 其次假设第一次跳跃发 
生在时刻 a < t , 并且从: r 跳到 y . 对所有可能的8和 J / 求和，我们得到丨和 (3.1) 
中一样 j 递推公式 

<^” +1 )( a ： ， r ) = <9 i 0) (*, r ) + j\- a ^a(x)d3- J K(x,dy)Qt\(y,r) (3.7) 

对 n = 0, 1，…成立.显然 QPU d 1 ), 从而根据归纳法有 Q t ( l ) < QP ) 彡…. 

由此推出，对于每对 a :, 尸，极限 

Q^ix.D = n lim Q ^( x , r ) (3.8) 

存在，但可能是无穷的.我们来证明，实际上有 

(3.9) 

[ 这菹含，对于《中的所有集合， Q[°°\x,r) < 1 ]. 只要证明对于所有的 n , 

C ? t (n) (*, f2) < 1 (3.10) 

就 行了. 当 n = 0时，这显然成立.利用归纳法：假设对于某一固定的 (3.10) 成 
立，则由 （3.7)( 注意 A ： 是随机的）可得 

gi n+1) (*,/?)< e _。 ⑷ * + f e - Q W * a ( i)ds = 1, (3.11) 

从而 (3.10) 对于所有的 n 都成立. 

根据单调收敛性从 (3.7) 可以推出， Qi oo ) 满足原来的积分形式的向后方程 (3.1) 
[ 从而也满足积微分形式的向后方程 (3.2)]. 对于 (3.1) 的任一其他正解 Q t , 显然 
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有 Qt > Q 巧把 （3.1) 和 (3.7) 比较，我们可知对于所有的 n,Q t ^ Q [ n) , 从而 
Qt> Q^- 因此， Qt^ 称为向后方程的最小解； （3.9) 说明 Qi °°) 是随机的或次随 
机的. 

由 (3.8) 推出， Q ^^ r ) 是经过有限多步从 x 转移到 r 的概率.因此对于次 
随机解，亏量1 表示以 i 为起点，在时间 t 内发生无穷多次跳跃的概 

率.从第1卷 17.4 节和 8.5 节例 （ c ) 中我们知道这种现象发生在某些纯增殖过程中， 
从而次随机解存在.但与其说它们是一个规则，倒不如说它们是一个例外.特别地， 
如果系数 a (*) 是有界的，那么最小解是严格随机的，即 

Q^ oo) (®,/2) = 1, t>0. (3.12) 

实际上，如果对于所有的 x , a (*) < o < oo , 那么可用归纳法证明，对于所有的 n 和 

t >0, 

Qj n) (®, fl ) > 1 - (1 - e - Qt ) n . (3.13) 

当 n = 0 时，这显然 成立. 假设对于某个 n , (3.12) 成立，注意右边是一个减函数， 
把它表示为 f(t). 考虑满足 r = /?的 （3.7) .由 (3.13) 知道，内层的积分彡 
不依赖于积分变量 •对 a(x)e~ a ^ 积分可得，当把 n 换为 n + 1时， (3.13) 也成立. 

最后我们注意，在严格随机的情形 （3.12) 下，解 Qi 00 ) 是唯一的.事实上，由 
Qi ° o) 的最小性，任一其他的解应满足 

Qt(x,f2) = Q t (x,r) + Qt(x, n-n 
> Q < t oo \x,n+Q^ix, n-n =/?) = 1 ， ' 

这是不可能的，除非上式中的等号均为不 等号. 因此，我们证明了. 

定理向后方程有一个由 (3.8) 所确定的最小鮮 Ql —, 此解对应于只炷过有限步 
从; r 转移到 r 的过程.它是随机的或次随机的. 

在次随机的情形下，亏量 l-Q^Or, ⑺是 在时间 t 内发生无穷多次跳跃的概牟， 
在这种情形下最小过程终止. 

在严格随机的情形 (3.12) 下，最小解是向后方程的难一板率解.当系數 (》(*) 有 
界时，出现这种情形. 

在 20 世纪 30 年代这个理论的早期阶段，亏损解的发现是令人震惊的，但是它 
推进了导致马尔可夫过程统一理论的研究.在无穷多次跳跃后可以从: r 转移到 r 
的过程，与具有边界条件的扩散过程类似，因此它们并不像一开始时看上去那样反 
常. 无穷多次跳跃的可能性也说明了直接推导向前方程的难度 .® 向后方程可以从 
①试与第1卷 17.9 节中的类似讨论相比较. 
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下列假设 推导： 给定现在的状态 a ：, 下一次的跳跃发生在服从于期望为 1/ c ^ aO 的 
指数分布的等待时间之后.向前方程依赖于在时刻*之前的状态，从而依赖于整个 
空间仏特别地，不容易直接表达下列 要求： 在时刻 t 之前存在最后一次跳跃. 

但是，在附录中将证明， 最小解自然满足向前方程，并且也是向前方程 
的最小解. 特别由此推出，如果 a 是有界的，那么 0 [°° ] 是向前方程的 唯一解 .当 
是次随机 解时， 存在包含经过无穷多次眺跃的转移且满足向后方程的各种过 
程.这样的过程的转移概率 Q « 可以但不一定满足向前方程.这个惊人的事实说明， 
在向前方程不能由 （3.4) 导出的情形下，向前方程可能被满足. 

最后我们再注意到（与 10.2 节的过程和包含对: r 的导数的扩散过程相反)，纯 
跳跃过程不依赖于基本空间的性质：我们的公式适用于任一个在其上定义着一个 
随机核 K 的集合仏 

例可 数样本 空间. 如果随机变量义⑴是正的且取整数值，那么基本样本空间由 
整数 l ,2 r ••组成.现在只要知道从一个整数向另一个整数的转移概率&⑴就行 
了； 所有其他的概率可由对 fc 求和 得到. 整数上的马尔可夫过程理论曾在第1卷 
17.9 节中讨论过，但在那里还考虑了非平稳转移概率.为了把理论局限于平稳情形， 
应假设系数 Ci 和概率是与 t 无关的.这样那里的假设与现在的假设相同，并且 
容易看出，在第1卷 17.9 节中导出的两个科尔莫戈罗夫方程是 （3.2) 和 (3.5) 的特 
殊情 形丨把 a ( i ) 换成 Ci,K(i,j) 换成 i ^]. 第1卷 17.4 节中的发散增殖过程是在有 
限时间区间内有无穷多次跳跃的过程的例子.我们将在 14.7 节中再回过头来讨论 
这个过程，那时将说明存在这样一个从 i 到的转移，它经历了无穷多次跳跃. 

附录®向前方程的最小解.向后方程的最小解的构造经修改后可适合于向前方程. 
我们简短地指出怎样修改以及怎样验证两个解事实上是相同的.细节留给读者 • 

K*(x,r) = j^-^K^xAv)- (3.15) 

为了构造向前方程的解，我们用 （3.6) 来定义并设 

Q[ n+l \x,r) = Q[°\x, D + f o j Q[Z\(x,dy) a ( V )K*{y,r). (3.16) 

这就用最后-次跳跃[正如 （3.7) 涉及第一次跳跃-样 j 确定了至多经过71+1步的转移的 
概率.重复上一定理的证明可以看出是向前方程的最小解. 

® 在 14.7 节中这个理论是用拉*拉斯变换的方法讨论的.（为簡单起见，只讨论了可数空间，但是论证 
无 1B 作本质上的改变就可适用于一殼的空间 .） 书中的直接方法不大优美，但有一个优点，即它也 
适用于異有依赖于时间参数 t 的转移撅率的非乎 ft 过程.这种一般形式的理论叙述见 Feller, TVans. 
Amer. Math. Soc., vol. 48 (1940) pp. 488-515[erratum, vol. 58, p. 474]. 
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虽然我们利用的宇母相同，但是两个递推公式 （3.7) 和 (3.16) 是无关的，并且结果得到 
的核是相同的这个事实绝不是明显的.为了说明这一点，我们设 P t (n) = Qi n) _ Qi n_1) ，这 
对应于恰好经过 n 步的转移.于是 (3.16) 化为 

P t (n+，) (*. r、= j: j 片 : i (*. dy)a(y)K*(y,r). (3.17) 

我们用标准的记号 P , (B+l) = P t ( n ) U 来表示上式.对于递推公式 (3.7), 我们类似地记 
P , (n+l) = ® P t ( B ) . 开始的在两种情形下是一样的[由 (3.6) 所确定].我们现在来 
证明，两个递推公式导致相同的结果.更确切地说，由 P t (n+1> =/>/">!! 定义的也满足 
P t (n+,) = BP /" 1 . 我们用归纳法证明，假设这个断言对于所有的 n ^ r 都成立，于是 

P, (r+1) = P t (r) U = (BP, (r_1) )U = «B(P t (B- 1 ) il) = ®P t (r) , 

因此归纳法假设对 n = r +1也成立. 

因此，我们证明了最小解为向后方《和向前方《所共有. 


10.4 R 1 中的扩散过程 

在考虑了所有的变化都以跳跃的方式发生的过程以后，我们转向另一个极端， 
即样本函数是（以概率 1) 连续的.它们的理论与上节所述的理论是平行的，但基本 
方程需要更复杂的分析 工具. 因此，我们将满足于向后方程的推导以及有关最小解 
和其他问题的简要概括.扩散过程的原型是布朗运动丨或维纳过程 1. 这是一个具 
有独立正态分布增 M 的过程.它的转移概率密度为 q t ( x , y ), 此密度是期望为 a :、 方 
程为 d 的正态密度.其中 a > 0是常数.这些密度满足标准扩散方程 


9qt{x,y) = 1 
_ 9t ~ 一 2 ~d^ ~ 


(4.1) 


现在来证明，其他的转移概率由有关的偏微分方程所决定.这个推导的目的只是为 
了让读者了解一下过程的类型和有关的问题，从而起一个初步介绍的作用.因此， 
我们将不致力于一般性或完整性 • 

由正态分布的性质显然可见，在布朗运动中，在长度为 t 的短时间区间内的 
增置具有下列性质：⑴对于固定的 <5 > 0, 位移大于 <5 的概率是 o(i);(ii) 位移的 
期望是 0; (iii) 它的方差是 at 我们保留第 1 个条件，但改变其他条件使之适用于 
非均匀 介质. 也就是说，我们令 a 依赖于并容许有非零的平均位移.在这种情形 
下，位移的期望与方差不与《严格成正比，我们只能假设在给定 X ( T ) =* 时，位 
移 X{t + T )- X { r ) 的期望为 b ( x)t + o { t ), 方差为 a ( x ) + o { t ). 矩不一定存在，但是 
由第1个条件知道，考虑截尾矩是很自然的.这样考虑可导致下列的《 
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转 移概串 Qt 的公设①对于每个 <5 > 0, 当 f — 0 时， 


/ Qt(x,dy) -»0, 

(4-2) 


* -1 [ (y~ x)Q t (x,dy) -» b(x), 

J|y—z|<4 

(4.3) 

< -1 f (y - x) 2 Q t (x,dy)a{x). 

J\y-x\<S 

(4.4) 


注意，如果 (4.2) 对于所有的 <5 > 0都成立，那么 （4.3) 和 (4.4) 中的量的渐近性质 
与 (5 无关，因此在最后两个关系式中可以把 <5换成 1. 

第一个条件保证大位移是不可能的，它是在1936年引入的，当时人们希望它 
是样本函数连续的充要条件_®为纪念林徳伯格，这个条件以他的名宇命名，因为 
它与中心极限定理中的林德伯格条件类似.可以证明，在关于转移概率的适当的正 
则性条件下， （4.3) 和 (4.4) 中的极限的存在性确实是 (4.2) 的推论.我们将不讨论 
这些细节，因为现在我们对发展系统的理论不感兴趣 .® 我们的一般目的是说明最 
简单情况下扩散方程的性质和经验 意义. 为此目的，我们来说明怎样由 （4.2) 〜 (4.4) 
形式地推导一些微分方程，但是我们将不讨论在什么条件下这些方程有解 .® 因此， 
系数 a 和6可以取为有界连续函数，并且 a (; c ) > 0. 

我们取直线上的有限或无限区间 J 为基本空间，并保持下述约定 •• 当积分限不 
出现时，积分是在区间/上进 行的. 为了简化写法并为半群理论的应用做准备，我 
们引入变换 

u(t,x) = J Q t (x,dy)uo(y) (4.5) 

(对于固定的 i ), 它把有界连续的“初始函数” uo 变成值为 u ( t ， a :) 的函数 ®. 


① 爱因斯坦迕先由*串假设推导出 r (4.1). 科尔典戈罗夫在他的1931年的著名论文中给出了向后 
方程 (4.6) 和向前方程 （5.2) 的第1个系统的推导（见 10.2 节).本书中的改进了的公设应归功于 
费勒 (1936), 他给出了第1个存在性证明并研究了两个方程之间的关系. 

② 这个推测被 D . ^所«证. V . 

® 现代半群理论使作者龅推导出满足林徳伯格型条件的马尔可夫过程的最一般的向后方程(生成元). 

古典的徽分算子可换成现代的形式，其中•自然尺度■•接替了系数6的角色，•速率测度•揍播了 a 
的角色.这些过程是 E . B . 邓肯及其学派的富有成果的研究的对象，也是伊藤淸 （ K . Ito ) 和典克钦 
( H . P . McKean ) 的富有成果的研究的 对象. 在参考文歒中引用的这些作者的书中，叙述了 整个理 
论 ■ 

® 关于用拉普拉斯变換的方法处理扩散方程，见 14.5 节. 

® 用 K 机过程的术语来说，是 uo ( X ( t )) 在餒设 X (0) = x 下的条件期 a . 
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显然，当知道了 (4.5) 式左边对所有的初值 《 o 的值时，就唯一地确定了 Q t . 现 
在我们来证明，在适当的正则性条件下， u 必然满足向后方程 

du 1 d^u du .. 

m = 2 a d^ +b ^ , (4 - 6) 

此方程推广了标准扩散方程 (4.1). 我们来找这样的函数 u , 它满足 (4.6) 且当 i — 0 
时 U ( M ) — ⑻.当解是唯一的时候， 这个解 必然有 （4.5) 的形式 ， 称为方程 
的格林 ( Green ) 函数.解不唯一的情形将在下一节中讨论. 

为推导向后方程 (4.6), 我们从下列恒等式 开始： 

u(a + t , x ) = j Q ,( x , dy ) u ( t , y ), a,t > 0. (4.7) 

它是査普曼-科尔莫戈罗夫方程 (1.3) 的直接推论.由它得到，对 ft > 0, 

…+土’今二’“’疋) = Qh ( x , dy )[ u ( t , y ) - u ( t ,®)]. (4.8) 

我们现在假设转移概率是充分正则的，以保证 (4.5) 中的变换 U 关于 a : 的一、 
二阶导数是有界连续的，至少在 uo 是无穷可微时是如此.那么根据泰勒公式，对于 
给定的 e > 0和固定的 z , 存在 <5 > 0,使得对所有的 \ y - x \^ S , 

| u ( t , y ) - u ( i , i ) - (y - -\( y ~ < e\y - 1 | 2 . (4.9) 

对于这个 <5, 考虑去 /" 以及去 /" Q h ( x , dy )[ u ( t , 

" J \ y — x\>S 〃 */| v - z |<4 

y )~ U (*, a :)]. 由 （ 4 .2) 和 u 的有界性，知前者趋于 0. 由条件 (4.3). (4.4) 和 （4.9) 可 
以看出，对于充分小的 h , 后者与 (4.6) 的右边之差小于 e •<»(*). 因为 e 是任意的， 
所以这就是说当 /I — 0时， (4.8) 的右边趋于 (4.6) 的右边.因此，至少右边导数 
du/dt 存在且由 (4.6) 给出. 这个理论的主要结果可以粗略地总结如下. 如果马尔可 
夫过程的转移概率满足连续性条件 (4.2), 那么这个过程祓系敫{■和 a 所 确定. 这似乎 
是理论上的，但是在实际情况下，系数&和 a 是亊先根据它们的经验定义和过程的 
性质给出的. 

为 了说明6和 a 的意义，考虑在短时间区间上的增鼉 X (* + r )- X ( t ), 假 
设 X ( t ) = X. 如果（ 4 .3)和 (4.4) 中的矩是完全的，那么这个增量的条件期望是 
b ( x)t + o ⑷，它的条件方差是 a ( x)t - 6 2 ( i ) t a + o ( t ) = a ( x)t + o ( t )- 因此， 6(: c ) 是位 
移的局部平均速率的一种董度（由对称性，它可以是0)， a ( a ;) 是方差的一种董度. 
由于没有更好的 术语， 所以我们称& 为无穷小速度 (或推移)，称 a 为无穷小方差. 
下例说明在具体情况下确定这些系数的方法. 
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例 （ a ) 布朗 运动. 如果假设 a : 轴是均匀且对称的，那么 a ( i ) —定与 a : 无关， 6(®) 
一定等于 0. 因此，我们有古典扩散方程 (4.1). 

例 （ b ) 奥因斯坦-乌伦别克 ( Omstein - Uhlenbeck ) 过 程是通过让作布朗运动的质 
点受弹力作用而得到的.在分析上这就是说向原点的推移速度与距离成正比，即 
b(x) = px. 因这对无穷小方差没有影响，所以 a ( a0 仍是常数，比如说是 1. 向后方 
程的形式为 


du(t, x) 1 ^uit, x) x) 

~dt ~ = 2 dx 1 押 dx 


(4.10) 


幸好这个方程容易求解.实际上，变 M 替换 




把它化成 


进一步的变墩替换 


把 （4.11) 变成标准扩散方程 (4.1), 由此推出， 奥因斯坦-乌伦别克过程的转移密 
度 ft (: c , y ) 与这样一个正态密度一致，它以 xe -辦 为中心且具有 (4.12) 给出的方差 r . 

在 3.8 节例 （ e ) 中已说明奧因斯坦-乌伦别克过程被 (4.10) 所确定，初始正态 
分布是唯一的具有平稳转移概率的正态马尔可夫过程 . 1包括布朗运动，它是 p = 0 
的特殊情形 .j 

例 （ c ) 遗传学中的 扩散. 考虑 一个具有不同代和固定大小 AT 的总体.（玉米田是 
—个典型例子 .） 有 2 JV 个基因，每个基因属于两种基因型之 一. 我们用表示>1 
型基因的比例.如果无视选择优势和突变，那么可以把第 （ r » + l ) 代的基因取作第 
n 代基因的大小为 2 JV 的随机样本.那么过程是马尔可夫过程，0彡彡 1. 在 
给定= * 时， 2NX n+ i 的分布是均值为 2Nx、 方差为 2Nx(l - x) 的二项分布 • 
每一代的变化的期望都是0,方差与 ®( l - ar ) 成正比. 

现在假设我们考察很多的代并引入一种时间尺度，使其发展过程似乎是连续 
的. 在这种近似下，我们讨论的是这样一种马尔可夫过程，它的转移概率满足我们 
的基本条件，并且 6( ar ) = 0, a ( a :) 与 *(1 一 a :) 成正比.比例因子依赖于时间尺度的单 
位，且可以正规化为 1. 于是 (4.6) 化为如下的形式> 


dv _ 1 df^v 
dt = 23^' 


(4.11) 


(4.12) 


du(t, x) 


dt 




9 3 u ( t , x ) 

a ® 2 


(4.13) 
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这次过程局限于有限区间 0 H ：. 选择和突变引起了一个推移，导致了有一个附加一阶 
项的方程 (4.3). 结果所得的模型在数学上等价于 R. A. 费希尔和赖特 （ S . Wright ) 所 
研究的模型，虽然他们的论证是不同的.由于总体的大小为固定的这一假设，模型 
的遗传含义有点模糊，总体大小的影响一般不被 注意. 正确的叙述 ® 依赖于一个有 
两个空间变童（基因频率和总体大小）的方程. 

例 （ d ) 总体的增长.我们想要描述一个大总体的增长，其中的个体是随机独立 
的，并且繁殖的速度不依赖于总体的大小.对于很大的总体，这个过程可以近似地 
看成连续的，即由一个扩散方程所 决定. 个体的独立性蕴含无穷小速度与方差一定 
与总体的大小成比例.因此，这个过程由具有 a = ax^\b = 0x 的向后方程 (4.6) 
所决定.常数《和0依赖于时间单位的选择和总体的大小，选取适当的度 M 单位， 
可以使《 = 1，/3 = 1，一 1,或 0( 依赖于净增长速度). 

在第1卷1 7 .5节 (5.7) 中用离散模型描述同样的总体 增长. 给定 X ( r ) = n ，假 
设事件 X(t + r )= n + l , n - lffin 的概率分别与 Ant , / mt 和1 - (A + n)nt 相差一 
项 o[f), 因此无穷小速度与方差是 （ A - p ) n 与 (X + n)n . 只要取极限就可得到扩 
散过程，可以证明它的转移概率是离散模型中转移概率的极限. 

用扩散过程类似地逼近离散过程常常是有 用的； 从普通的随机游动过渡到第 
1卷 14.6 节中所述的扩散过程提供了一个典型的例子•[在 10.5 节例 ( a ) 中继续讨 
论 • 1 ► 


10.5 向前方程，边界条件 

在本节中为了简单起见，我们假设转移概率 Q t 有一个由一随机密度核 q t (x,y) 
给定的概率密度 

变换 (4.5) 和向后方程 (4.6) 描述了依赖于起点 z 的转移概率.从概率的观点 
来看，取起点 a : 为一固定点并把 q t (x,y) 看作终点 y 的函数似乎更自然.从这个观 
点来看，变换 (4.5) 应换成 

v(8,y) = J Mx)q,(x,y)dx, (5.1) 

此处如是任意的概率密度•由心的随机性推出，对任意固定的 s > 0,变换 v 仍是 
概率 密度. 换句话说，虽然变换（ 4 .5)作用于连续函数上，但新的变换把概率密度变 
成新的密度. 

在10. 4 节中我们能用概率方法证明变换 (4.5) 满足向后方程 (4.6). 虽然从概 
率的观点来看，新的变 换更为自然,但是用类似于推导向后方程的直接方法来推导 

① W. Feller, Proc. Second Berkeley Symposium on Math. Statist, and Probability, 1951, 
pp.227-246. 
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向前方程是不可能的•然而，由伴随偏微分方程的一般理论似乎 应有： （在充分的正 
则性条件下> 应满足方程 ® 

—[<»( l /) w («. I /)] - ^[%)«(«,!/)]. (5.2) 

在概率论中这个方程称为向前方程或福克-普朗克方程. 

在进行推导之前，我们先举例说明这样一种信息，从 （5.2) 推导它要比从向后 
方程推导它容易. 

例 （ a ) 总体的增长 • 10.4 节例⑷导出了向前方程 

坤， y) = a ^yv(^y) _ Q^yv^y) ⑽ 

da 一 dy 2 dy ' ' ' 

可以证明，对于给定的初始密度存在唯一的一个解.虽然难以获得显式解，但 
是从这个方程可以直接得到许多有关的信息.例如，为了计算平均总体大小 M ⑻， 
用1/乘 (5.3) 式并关于1/从0到 oo 进行 积分. 在左边我们得到导数 M '( a ). 利用分 
部积分法，并假设 u 在无穷远处趋于0的速度比 l / i / 2 趋于0的速度快，可以看出 
右边等于 0M(a). 于是 

M'(a) = 

从而 M («) 与 W 成比例.类似的形式计算表明方差与 2 a /?- 1 . 成比例. 

①这里是对 (5.2) 的推导的一个非正式的橛述.由转移概串的査普曼-科尔其戈罗夫方程（1.3)»出 

J «(«, vM *. v)dy 

只依赖于 s + t. 因此， 

f ^ 二 V ) U ( t,V ) dv = f V (* ,v ) 9t ^ V ) dy . (*) 

我们现在按照向后方程 (4.6) 来表示 9 u /9 t , 并对所 得的积 分应用薹然的分部积分公式.如果 
«(*,V) 表示 (5.2) 的左边，那么我们断言 （*) 等于 



加上一个只依赖于11, v 及其在边界上（或在无穷远处）的导败的*.在适当的条件下，这些边界项 
可以忽略不计，在这种情况下，令 t — 0. 取 ft 限就可得到悄等式 
/ - R (*，**)] ** o ( V ) d » = 0、 

如果此式对任意的 uo •成立-,那么括号中的表达式应等于0.即 (5.2) —定成立. 

这个论证在大多数的实际情况下是行得通的，因此向前方程 （5.2) -ft 是成立的.但是在所谓 
的回返过程中，被我们忽略的边界项碥实起一定的 作用. 因此，这种过程的转移概率满足向后方程 
(4.6), 伹不满足 (5.2). 在这种情形下，正*的向前方程 ft —个具有不同形式的方程. 

此外还值得注意的是， (5.2) 是无意义的，除非 a 和6是可徽的，而对向后方程却 R 有这样的 
限制.当 a 和6不可徽时，也可以写出正聽的向 «T 方程，但是它包含 10.4 节的第3个脚注中提到 
的广义微分算子. 
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[ 与离散情形下的类似结果，第1卷第17章的公式 （5.10) 和 (10.9) 进行比较 •] 显 
然，这种计算的合理性需要加以说明，但是这个结果至少有一定的启发性，而且不 
明确地算出就无法从向后方程得到这个结果. ► 

向前方程和向后方程之间的关系类似 10.3 节跳跃过程的情形下所述的关系. 
我们不加证明给出简要的概括. 

在开区间217^2上考虑向后方程(4.6)，这区间可以是有限的或无限的.我们假 
设 a > 0,并且为使 (5.2) 有意义，假设系数 a 和6是充分正则的.在这些条件下， 
存在唯一的一个最小解 Q t , 使得 (4.5) 是向后方程 (4.6) 的解.不好办的是，对于固 
定的 t 和 a :, 核 Q t ( x , r ) 可能表示亏损分布.在任何情形下， Q t 有密度， (5.1) 的函 
数 u 满足向前方程.事实上，在 10.3 节所述的显然的意义下，这个解又是最小的. 
在这个意义上，向前方程是向后方程的推论.但是，这些方程只有当最小解为非亏 
损解时才唯一地确定 过程. 在所有其他的情形下，过程的性质被附加的边界条件所 
确定. 

从第1卷第14章中讨论的0^5上的简单随机游动类推，边界条件的性质很 
容易理解.许多约定在首次到达原点时是有 效的. 在破产问超中过程停止；在这种 
情形下，称原点为吸收壁.另一方面，当原点作为反射壁时，质点立刻回到位置1, 
过程永远继续下去.问题是为使边界条件出现，当且仅当到达边界点.由轨道函数 
的连续性,“在时刻 < 前巳到达过边界点; c 2 ” 这个事件在扩散过程中是完全确定的. 
它与跳跃过程中 “ t 前发生无穷多次跳跃”这个事件密切相关. 

在某些扩散过程中，以概率1达不到任一边 界点. 布朗运动 [10.4 节例 （ a )] 就 
是这样的 过程. 于是最小解表示一正常概率分布，且不存在其他的解.在所有其他 
的情况下，直到到达边界之前，最小解决定 过程. 它对应于吸收壁，即它描述了到 
达边界点时终止的过程.这是最重要的一类过程，不仅是因为所有其他的过程都是 
它的推广，而且更因为所有的首次通过的概率都可以利用人为的吸收壁来计算.这 
个方法一般是可行的，但我们将用最简单的例子来 说明. （它实际上巳暗中被利用 
于随机游动和别的地方，例如在第1卷 17.10 节的习題18中 .） 

在下例中我们把注意力局限于简单的方程 (5.4). 更一般的扩散方程将在 14.5 
节中用拉普拉斯变换的方法来处理. 

例 （ b ) —个吸 收壁. 首次遢过时间■考虑0^5上的一个在原点上有一吸收壁的布 
朗 运动. 更确切地说，在时刻0从点 a : > 0出发的布朗运动在首次到达原点的时刻 
停止.由对称性，向后方程和向前方程都呈古典扩散方程的形式 


du ld^u 

at = 2dx^' 


(5.4) 


与在随机游动的情形一样，适当的边界条件是对所有的 t , q t ( 0 , y ) = 0 . (这个断言既 
可由第1卷 14.6 节中的取极限的办法证明，也可由解的最小性来证明 .） 
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对于给定的 u 0 , 我们来求 (5.4) 的这样一个解，它对 t ^0, x ^0 有定义，且 
使得 u (0, x ) = u o ( x ), u ( t ，0) = 0. 它的构造依赖于应归功于开尔文 (Lord Kelvin ) 的 
映像法. ①我们借助于 « o (- a ：) = - 匈⑷把延拓到左半直线，并在=55^5上对 
这个初始条件解 (5.4). 由对称性，这个解满足条件 u ( t ,0) = 0,再把 a : 局限于0^5 
上，我们就得到所要求的解.它由(: cj ) 在0^5上的积分给出，其中 

= vfa [ exp ( _ -exp (~ ^r - )]- (55) 

因此， ft 表 示我们 这个过程的转移密度 (f >0, z >0, y >0). 容易看出，对于固定的 
是 (5.4) 的一个满足边界条件 g t (0, i /) = 0 的解 .[ 关于更系统的推导见 14.5 节 
例 （ a ).] 

对2/积分，我们得到在时刻 t 的总概率质 M 

r 9t ( x , y)dy = 291(®/ Vi ) - 1， (5.6) 

Jo 

其中 91 表示标准正态 分布. 换句话说， （5.6) 是从 a ; > 0 出发的轨道在时刻 t 前不到达 
原点的 概率.在这种意义上， (5.6) 表示一自由 布朗运动中的 首次逯 过时间 的分布 • 
注意， (5.6) 可以看作是微分方程 (5.4) 的解，此解定义在 I > 0上，满足初始条件 
«(0, *) = 1 和边界条件 u ( t , 0) = 0. 

【在 (5.6) 中我们看出了指数为 a = i 的稳定分布，在 6.2 节中通过随机游动 
取极限得到过同样的结果 .] 

例 （ c ) 两个吸 收壁. 现在考虑受到两个在0和 a > 0点的吸收壁阻碍的布朗运动. 
这就是说，对于固定的0 < 1 / < a , 转移密度 (/ 1 应满足微分方程 （5.4) 和边界条件 
9 t (0, l /) = 9 t ( a , y ) =0. 

容易验证此解为® 

(5.7) 

其中0 < a :, 2 / < a . 实际上，此级数显然收敛，项的明显的相互抵消说明对于所有的 
t >0 m 0< y < a , q t (0, y ) = « t ( a , y ) = 0. [(5.7) 的拉普拉斯变换将在 14.5 节 (5.17) 
中给出 . 1 


①关于适用于差分方程的同一方法，见第1卷 14.9 节中的习 * 15 ~习雇 18. 

® 此构造 依纊亍 利用®复反射的逐次通近，在 (5.5) 中我们有满足0点的边界条件但不满足 o 点的 
边界条件的解.在 a 点的反射导致一个满足<1点的边羿条件但不膚足0的边羿条件的由4项組成 
的解.在0和 a 点交誊反射并取极®可得 (5.7). 随机游动的类似解巳在第1卷 14.9 节 （9.1) 中 
给出， (5.7) 可以通过它利用第1卷 14.6 节所述取极限的方法推导 出来. 
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在0 < y < «上积分 (5.7), 我们得到具有下列形式的在时刻 t 的总概率质童> 

fc=—oo v v 

^/2*：0 + 0 + *\ ^./2 fca + x\i 

，（- Vt -) +9l (^-)}- (5-8) 

这是从 a : 出发的质点在时刻 t 前未被吸收的概率. 

函数、是扩散方程 (5.4) 的解，当 t — 0时它趋于1且满足边界条件 Aa ( M )) = 
A o ( i , a ) = 0. 也可以借助于傅里叶级数的方法得到这个解的下列形式 

( 5 . 9 ) 

于是我们得到了同一函数 Aa 的 2 个完全不同的表达式 ®. 这是很幸运的，因为 
(5.8) 中的级数只有当 t 较小的时候才收敛，而 (5.9) 却对较大的 t 适用 • 

为了给出 A a 的另一种解释，考虑一个从原点出发的布朗运动中的一质点的# 
SX ( t ). 我们说，在时间区间0^内，质点逗留在- a /2, a /2 内,相当于说，在 ±^a 

上有吸收壁且从 0 出发的过程 在时刻 t 前 不发生吸收. 因此，等于在从原 
点出发的自由布朗运动中， 《| X ( a )| < 对所有的0 < a < t 都成立”这个事件的概 

牟. 

例 （ d ) 在极限定理和科尔奠戈罗夫-斯米尔诺夫检验中的应用.设 vi , y 2 , …是 
独立同分布的随机变量，并设 E { Yj ) = 0, E ( Y /) = 1•设 s „ = y , +…+ v „, r „ = 
max [|5 i |,---,|5„|]. 由中心极限定理，似乎应有 i r „ 的渐近性质几乎与 V }是正 
态变最的情形一样.在后一情形中，正规化了的和式 S k / y / H 与在时刻 k / n(k = 
0,1,…, n ) 的布朗运动的变世差不多大小相同.巳经知道，此布朗运动停留在区间 
(-k 5°) 中的概率 等于、 (1».因此，我们的似乎有道理的论证导致了下列 
猜想： 当 n — oo 时， 

P{r„ < *} — L(z), (5.10) 

其中 L ( z ) = A 2 ,( M ) 从 （5.8) 和 （5. 9) 得出， 


①随机游动的类似公式巳在第1卷 14.5 中 导出， 但在部里，边界条件是 A a ( t ,0) = 1和 A «( t , o ) = 0. 
® (5.8) 和 (5.9) 之间的恒等可作为泊松求和公式的标准例子[见 19.5 节 (6.10)]. 它有重》的历史意 
义，因为它最初是在0函数变换的雅可比理论中被发现的.见 Satz 277 in E . Landau , Vertetlun ? 
der Primzohlen , 1909. 
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L(z) = 2 £ W(4A：+ 1»- 9l((4fc- l)z)} 

- T ). <5 ' U， 

这个猜想于 1946 年为厄尔多斯 （P. Erd6s) 和 M. Kac 证明，是基本概念后来 
被称作不变性原理.粗略地讲，它说明随机变 M 的某些函数的渐近分布对这些变童 
分布的变化是不敏感的，可以通过考虑适当的近似随机过程来求得渐近分布.这个 
方法为 M. Donsker, P. Billingsley. Yu. V. Prohorov 等人予以完善，成了证明极限 
定理的一个强有力的工具. 

由于类似的理由，分布 (5.11) 在关于 1.12 节中所讨论的那种类型的非参数检 
验的大量文献中，也起了显著的作用 .® 

例 （e ) 反射壁.与普通随机游动类似，我们用边界条件来定义在原 
点上的反射壁，因为原点的反射壁的作用与随机游动的情形类似.容易验证，区间 
0^上的解由把减号换成加号的 (5.5) 式给出.除了设 M-x) = uo(x) 以外，利用 
映像法的形式推导是相同的.对于在0和 a 两点有反射壁的解可以类似地在 
(5.7) 中把减号换成加号得到.（用傅里叶展开式或泊松求和公式得到的另一表达式 
将在 19.9 节的习題11中给出 .） 

应当指出，在反射壁的情形下， ft 是正常概率密度. ► 


10.6 高维扩散 


容易把上述理论推广到二维的情形.为了避免麻烦的下标，我们用 (r(t).y(O) 
表示坐标变儀:，用 qt(x,y^,r,) 表示转移 密度. 这里是起点， ft 是以为自 
变童的密度.假设与 10.4 节中的一样，只是现在无穷小速度 6(ar) 是一向量，方差 


a(x) 是协方差矩阵.代替 （4.6), 我们得到向后护教方租 

du d^u d^u du 8u 

m =an dx^ + 2ai3 d^i +an W +bl di +(6 - 1} 
其中系数依赖于 a; 和 i/. 在二维布朗运动的情形，我们要求有旋转对称性，经过正 
规化，我们应有 


du 1 [5ti 2 护 《1 

m = 2[d^ + dy^\' 


( 6 . 2 ) 


①这个 WH 是比较新的，但是作为起点的恒等式 (5.11) 看 来巳经度而不用了. [A. Renyi, On the 
distribution function L(z). Selected Translations in Math. Statist, and Probability, vol. 
4(1963) pp. 219-224. Renyi 的证明依赖于涉及困败的古典论证，因而冲淡了 (6.11) 的镝单 
的*率意义 . 1 
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相应的转移密度是正态的，其方差为*,中心在 ( x , y ) ±. 此密度的明显的因子分 
解，说明 X ⑷和 y ⑷是随机独立的 • 

这个过程中最有趣的变量是到原点的距离 R { t )( R 2 = X ^ + Y 2 ). 直观上很明 
显， ■«(<) 是一个一维扩散过程的变量，比较一下求这个过程的扩散方程的各种方法 
是很有趣的.在极坐标下， (6.2) 的正态转移密度呈形式 
p 2 + r 2 — 2 prco »{0 — 

2 t 

(其中 i = rcosa , 等等).如果给定时刻0的位置则 i ? ⑴的边缘密度可通过 
(6.3) 式对0积分得出.参数 a 消失，我们得 到过租 ⑴的转移密度为® 

吾 exp (- - 2t~) Io {^t)' ( 6 . 4 ) 

其中知是 2.7 节 （7.1) 中定义的贝塞尔函数.这里 r 表示时刻0时的初始位置.由 
这个推导易见，对于固定的 A 转移概率叫满足极坐标下的 （6.2), 即 

警 4( 会4尝). 

这就是过《丑⑷的向后方 《. 只要要求有旋转对称性就可由 （6.2) 得到它. 

方程 (6-5) 说明过程⑴的无穷小速度是 l /(2 r ). 如果我们考虑从 z 轴上的点 
r 出发的平面布朗运动，那么存在一个远离原点的推移是不难理解的.由对称性，在 
时刻 h >0, 它的横坐标> r 或< r 的概率相同.在第1种情形下一定有 R ( h ) > r , 
但在第2种情形下这个关系式也可能 成立. 因此，关系式 R ( h ) > r 的概率> ^平 
均说来—定是增加的. 

转移概率的同样推导适用于三维的情形，但有一个本质的 简化， (6.3) 中雅可 
比行列式 P 现在应换成 p 2 ^, 且可以利用初等积分法.代替 (6.4), 我们得到三维 
中的过《丑⑷的转移密度 

坍 (r ， p) = [ exp (- 1 Sr-)~ exp ( - ( 6 . 6 ) 

( r 仍表示在时刻 0 的初始位置 .） 

10.7 从属过程 

如果引入一^所谓的随机化了的操作时间，那么可以从具有平稳转移概率(*， 
r ) 的马尔可夫过程 { A •⑴ } 导出各种新的过程.假定对毎个 t > 0 ,存在一个随机变 

® 这个积分是大家所 ft 知的.为了 16证，把展成 COB ® 的幂级 败. 



(6-3) 



304 第 10 章马尔可夫过程与半群 


量 T ⑷，它的分布为 I 7 t . 那么可以由下式定义一个新的随机核 

P t ( x ， r 、= h 一 Q a ( x , r ) U t { ds }. (7.1) 

这表示 X ( T ( t )) 在给定尤⑼ = 0 下的分布. 

例 （ a ) 如果 r ⑷服从期望为 at 的泊松分布，则 

Pt ( x , r ) = £ e - at ^ g n ( x , r ). (7.2) 

n =0 n ' 

这些朽 是一个伪泊松过程的转移概率.在 10.9 节中将证明，利用泊松分布的随机 
化导致一个所谓的指数公式，此公式是马尔可夫半群理论的基础.我们将会看到， 
对其他一些分布也可得出类似的结果，每个这种分布都导致一个与指数公式类似 
的公式. 

变 M X ( T (0) 构成一个新的随机过程，它不一定是马尔可夫过程.为使此过程 
是马尔可夫过程，显然， A 必须满足査普曼-科尔莫戈罗夫方程 

p »+ t [ x , r ) = J P »( x , Ay ) P t { y , r ). (7.3) 

这就是说， X [ T{t + a )) 的分布是利用巧( V ,/ 1 )对 A ■(: T ⑷）的分布进行积分得到的， 
因此根据条件概率的定义， 

Pt(y,n = P{X(T(t + a))€ r|X(r(s)) = y}. (7.4) 

高阶转移概率的类似计算表明， (7.3) 足以保证导出过程 ( A -( T (<))} 的马尔可夫性. 

我们现在想要求出导致 (7.3) 的解朽 的分布 t / t . 直接处理这个问题将会遇到 
许多困难，但是这些困难可以通过首先考虑如下的简单的特殊情形而避免， 变量 
r ( t ) 的所有值都是一固定数 h >0 的 倍数. 关于 r ( t ) 的分布，我们记 

P { T ( t ) = nh } = a „( t ). (7.5) 

如果给定 A ■⑼= a :, 那么 X ( T ( t )) 的分布为 

Pt { x , n = OfcWQfchC *. (7.6) 

fc =0 

因为核满足査普曼-科尔莫戈罗夫方程，所以我们有 

f P .( x , dy ) Pt ( y , r ) = ^2 aj ( 8 ) a k { t ) - Q { i + j ) h ( x , r ). (7.7) 

i,k 
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可以看出，核 P t 满足査普曼-科尔莫戈罗夫方程 (7.3) 的充要条件是对所有的 s > 0 
和 *>0, 

ao ⑷ a „ ⑷ + ai ⑷ 0 „-力） + ••• + On ( s ) ao ( t ) = a„(s + 1 ). (7.8) 

如果 { T ( t )} 是一个平穗独立增量过程，那么上述关系式成立， (7.8) 的最一般的解 
巳在第1卷 12.2 节中求出. 

这个结果导致如下的猜想，一般说来，只要 r ( t ) 是一平稳独立增量过程的变 
最，即只要分布满足 ® 

. U t + ,( x ) = jT U „( x - y ) U t { dy ), (7.9) 

则 (7.3) 成立.我们用取极限的办法来验证这个猜想 • ® 我们把 C / t 表示为刚才所述 
的那种类型的算术分布序列的 极限： 集中于数心的倍数上，它对点賦 
予的质最满足形如 （7.8) 的关 系式. 于是对每个 u 我们得到一个相应于 （7.6) 的核 
它满足査普曼-科尔莫戈罗夫方程 (7.3), 因此，为证 (7.1) 的核巧也满足査 
普曼-科尔莫戈罗夫方程 （7.3), 只需证明 -* 巧， 或者等价地，对每个在无穷 
远处等于0的连续函数/,都有 


J Pi V \ x ^ v ) f ( y ) j Pt ( x , dy ) f ( y ). 

(7.10) 

如果我们设 +oo 


fit , x ) = j Qt ( x , dy ) f { y ), 

(7.11) 

那么 (7.10) 可以写成形式 


J q F (8, x ) U ^ v ) { da } -* jT 00 F ( a , x ) U t { da }. 

(7.12) 


如果 F 是连续的，那么这个关系式一定成立，这只对 Q t 附加了一个极端微弱的正 
则性条件.因此，我们证明了下列基本结果. 

设 { A ■⑷ } 是一个具有连续的转移概芈 Q t 的马尔可夫过租，{了⑷}是一个具有非 
负独立增量的过程.那么 { X ( r ⑷) } 是一个具有由 （7.7) 给出的转移蜓牟的马尔可 
夫 过租. 称这个过程为通过操作时间 r ⑷而从属于{义⑴}的过过程 { r ( t )} 称 
为有向过程. 

① (7.9) 的最一般的解将在 13.7 节中用拉普拉斯变换的方法 给出. 也可以用无穷可分分布的一般理 
论来求它. 

® 直接骏证需®有一定的分析 技巧. 我们的方法再次说明朴索的方法有时是很有力的. 

③ 从肩 半鮮的 概念是 S . Bochner 在1949年引入的.关于一种较高级的系统方法，见 E . Nelson , A 
functional calculus using singular Laplace integrals , TVans . Amer . Math . Soc ., 88(1958), 
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当 X ( t ) 也是独立增量过程时，就会出现一种非常有趣的特殊情形.在这种情 
形下，转移概率只依赖于差 r _ a :, 并且可以换成等价的分布函数.于是 (7.7) 呈更 
简单的形式 

P t ( x ) = jf °° Q •㈤ tMds }. (7.13) 

我们所有例子都是这种类型的. 

例 （ b ) 柯西过程是一个从属于布朗运动的过程 •设 { X (0} 是转移密度为 qt ( x ) = 
(2^)-* 的布朗运动（维纳过程)，我们取 { T { t )} 为具有指数 | 和转移密度 

一 


的稳定过程.那么分布 (7.13) 的密度为 


他)- 去/二 0 Vvw 胸如_ 請 

因此我们的从厲化导致了柯西过程. 

这个结果可以用两个独立的布朗运动 x ( t ) 和 y ⑷解释如下. 

在 6.2 节例⑷中，曾证明了可以把认 解释 为过程 Y ( a ) 首次取得值 t > 0 的 
时刻的等待时间的 分布. 因此， 考虑过 《A •在 y ( a ) 首次取得值 t 的时刻 r ⑴上 的值就 
可以 得到柯西过程 Z ⑴. [关于柯西过程与布朗运动的首中时间的另一种联系，见 
6.2 节例 （ f ).] 

例 （ c ) 穗定过程. 容易把上例推广到指数分别为 a 和/3的任意的严格稳定过程 
{义⑷}和 { T ( i )}. 这里 a < 2,但是因为 r ( t ) 应当是正的，所以我们必然有 0< l . 
转移概率 Qt 和认具有形式 Q t ( x ) = Q ( xT l / a ) 和 U t ( x ) = U { xt ~ 1 ^), 其中 Q 和 
t / 是固定的稳定分布.我们来 证明从属过程 X ( T ⑻) 是指教为^/3的穗定过程. 这个 
断言等价于关系式 Pxt ( x ) = P t { x ~^). 由弘和认的给定形式来看，这个关系式 
显然可通过代换 s = yA 1 / 〃从 (7.13) 推出 • 

[ 我们的结果本质上等价于 6.2 节例 ㈨ 所导出的乘积公式.当 X { t ) > 0时， 
这个公式可以用拉普拉斯变换的术语来重新叙述，如 13.7 节例 （ e ) 中那样.关于傅 
里叶形式见 16.12 节中的习题 9 .J 

例 （ d ) 由伽玛过程定向的复合泊松过程 .设 Q t 是概率分布 F 产生的复合泊松分 
布，并设^有 r 密度 e -^- Vrtx ). 于是 (7.13) 呈如下的形式《 

Pt = Y / a n (t)F n *, 


(7.15) 



其中 
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(7.16) 


容易验证概率 a n ( t ) 具有无穷可分的母函数 E « n ⑷ C * = (2- C ) _t . 

例 （ e ) 由泊松过程定向的咖玛过 《• 我们现在考虑与例 （ d ) 中相同的分布，但它 
们的作用却正好相反.那么操作时间是整值的，0点的质世为由此推出结果所 
得的分布在原点有质贵为的原子.连续部分的密度为 


E • e_t ^ = e_t '*\/i /l(2VS), (7 - 17) 


其中 A 是 2.7 节 (7.1) 中的贝塞尔 函数. 由此推出此分布是无穷可分的，但直接验 
证是不容 易的. ► 
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第8章揭示了把概率分布作为连续函数的算子来处理的好处.用算子方法讨 
论随机核好处更大，半群理论导致了用其他方法无法得到的马尔可夫过程的统一 
理论.给定 R 1 上的一个随机核 K 和一个有界连续函数 tx , 关系式 

U { x )~ J K ( x , dy ) u ( y ). (8.1) 

定义了一个新函数.不失一般性，可设变换 f / 也是连续的.我们可以利用在连续函 
数空间中的导出变换 u — t / 来研究核的性质.有两个主要的理由促使我们考虑 
更一般的体系.首先，形如 (8.1) 的变换在任意的空间中是有意义的，讨论一个不包 
含最简单和最重要的特殊情形（即具有可数状态空间的过程，这时 (8.1) 化成矩阵变 
换）的理论是极不经济的.其次，即使在局限丁直线上的连续函数空间的理论中，各 
种类型的边界条件也迫使我们引进特殊种类的连续函数.另一方面，不用多大力气 
就可以得到更广泛的理论.如果读者思意的话，可以不顾一般性，而把所有的定理 
归于下列典型情况之一（或几种情形).⑴基本空间 r 是实直线，义是在无穷远处 
等于0的有界连续函数所成的类 •（ ii ) 空间是 R 1 或 R 2 中的有限闭区间 J , 是 
1 上的连续函数所成的类. ( Ui ) i 7 由整数组成， if 由有界序列组成.在这种情形下， 
最好把序列看成列向量，变换看作矩阵. 

和在第 8 章中一样，把有界实函数 U 的范数 定义为||«|| = 8 U P |«( x )|. 为使函数 
序列 {« n } 一致收敛于 ti , 当且仅当 || u „- u ||^0. 

今后 将表示某集合 S 上的具有下列性质 的实* 數奐 ： （ i ) 如果 Ul 和 U2 厲于 
那么每个线性组合 c!«i + c 2 t *2 e ( ii ) 如果€幺且 || U „ - — 0,那么 
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ue^f. (iii) 如果 UGJS?, 那么 u + 和 ti - 也属于幺(其中 u = 1* + - u-,u + 是 u 的 
正部，是 u 的负部).换句话说，幺在线性组合一致极限和绝对值运算下是封闭 
的.前两个性质使 y 成为一个巴拿赫空间，后一个性质使义成为格. 

下列定义是标 准的： 一个线性变换 r 是义上的一个自同态，如果每个 U €幺 
有一个像 Tu €兄使得 || Tu || < m ||«||, 其中 m 是一个与 tt 无关的常数.具有这个 
性质的最小常数称为 r 的范数 l | T ||. 称变换 r 是正的，如果 u > 0蕴含 r u > 0 . 
在这种情形下， -Tu- Tu + . 收縮算子是一个满足 || r || 《1的正 算子. 如果 

常值函数1属于 y , r 是满足 ri = 1的正算子，那么称 r 为推移 算子. （它显然是 
一个收缩算子 •） 

给定义上2个自同态 s 和 r , 它们的乘私 st 是把 u 映成 s ( ru ) 的自同态. 
显然， || fifr ||<||5||-|| T ||. —般说来， ST^TS, 这与 8.3 节中的彼此可交换的特殊 
的卷积算子不同. 

我们只对形如 (8.1) 的变换感兴趣，其中 K 是随机核或至少是次随机核.这种 
形式的算子是收缩算子或推移算子，它们还具有： 

单调收敛性如果 彡 0且 u „ t u ( u „ 和 u 部在义中)，那么 rw r « (处处收敘) • 

在几乎所有的情况下，具有这种性质的收缩算子都具有 （8.1) 的形式.下面的 
两个例子将说明这一点. 

例 （ a ) 令 E 表示实直线， 父= C 表示 E 上所有有界连续函数所成的类.令 
Co C 义是在±00上等于0的有界连续函数所成的 子类. 如果 r 是义上的收缩箅 
子，那么对于 u € C 7 0) Tti 在固定点3：上的值 Tu ( i ) M ^ 上的正线性泛函.由里斯 
表现定理，存在一个可能为亏损的概率分布使 Tn(x) 是 u 关于 F 的期望.因 
为 F 依赖于 z , 所以我们把 F ( r ) 记为 K{x,r). 于是对 u € C 0 , 

Tu(x) = J K(x,dy)u(y). (8.2) 

当 T 具有单 调收敛性时，这个关系式显然可推广到所有的有界连续函数上. 

对于固定的: r, 作为 f 的函数，核 AT 是一个测度.如果尸是一个开区间， {u„} 
是这样一列递增的连续函数，使得当 * €尸时«„(®) > 1,当: c 赛尸时 u „ ⑻0, 
那么由积分的基本性质， if(x,r) =limTu„(a:). 因为 Tu„ 是连续的，所以对固定 
的 r , 核 A ： 是 z 的贝尔函数，因此 A ： 具有随机核或次随机核所要求的一切性质. 
当把直线换为区间或 R " 时也有类似的情况 • 

例 （ b ) 令 I ： 是整数集，幺是有界数列 u = {x n } 组成的集合且 || U || = mp\x n \. 
如果 P 0 表示一个随机或次随机矩阵，那么我们定义这样一个变换 r , 使得的 
第 i 个分盘为 


(Tu)t = y^Pifctifc. 


(8*3) 
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显然： r 是一个满足单调收敛性的收缩算子；如果上面的矩阵是严格随机的，那么 
t 是一个推移 算子. ► 

这些例子是典型的，实际上很难找到不是由随机核导出的收缩算子.不管怎样， 
我们有理由对收缩算子的一般理论进行讨论，而且确信它在概率中的重要问题上 
的应用是显然的.（事实上我们决不超出这些例子的范围 .） 

马尔可夫过程的转移概率构成一个单参数的核族，它满足査普曼-科尔莫戈 
罗夫方程 , 

r ) = j Q s ( x , dy ) Q t ( y , T ) (8.4) 

(s > 0,« > 0), 积分区域是基本空间.每一个核导出一个由 T 式定义的推移算子 
Q ( t ) u [ x ) = J Qt { x , dy ) u ( y ). (8.5) 

那么 (8.4) 显然等价丁- 

£2 (s + t ) = £2( s ) Q («), «>0, t >0. (8.6) 

具有这种性质的同态族是 半群. 显然， Q ( s ) Q ⑴= Q ( t ) Q ( a ), 即半群的元素是彼此 
可交换的 • 

称 if 上的自同态的序列收敛于①自同态 r , 当且仅当对每个《 e if , || r n «- Tu || 
— o . 在这种情形下，我们记 r „- r . 

今后我们集中力世研究收缩箅子半群，并对它们附加一个正则性条件.仍用1表 
示恒等算子 ， lu = u . 

定义收缩算子 Q ⑷组成的半群称为连埃的®,如果£1(0) = 1且当 A — 0+ 时 
1. 

如果 0< t '< t 〃， 那么我们有 

\ W >- < || Q ( t H -0«- u ||. (8.7) 

对于连续半群，存在这样的 <5 > 0,使得当 t 〃 _ f < 6时，上式右边小于 e . 因此， 
不但当 t — < 0 时 Q ⑴ — Q (« o ), 而且 (8.7) 说明，对于每个固定的 u , 是 * 

①这种形式的收敛已在 8.3 节中引入过，称为强收敢.它不*含 ||r„ - r|| -»o( 这种类 a 的收 敢称为 
一致收敛).可以按下列方式定义较弱的收敛I对于毎个 TnU(l) - Tu(x), 但不一定是一致收 
敛.见 8.10 节中的习* 6. 

® 我们利用 这个闻 作为标准术语•在《点强连续*的*写. 

® 存在这样的半群，使得 0(h) 趋 于算子 Tjil , 但它们是病态的.例如，把自同态 r 定义为 
Tu ( x ) = iu(0)|l + cosa] + ^u(n)[ 1 — cosz], 

并对所有的 t>0, 设 £l(t)=r. 
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的一致连续函数. 

当然变换 （8.1) 和 (4.5) 相同，都可作为推导扩散过程的向后方程的起点.一族 
马尔可夫转移概率也可导出这样一个測度变换半群，使得测度 A 变换成测度 nt )^, 
后者对集合 r 賦予质量 


T ( t )/ i ( r ) = J (8.8) 

当有密度核山时，这个变换和 （5.1) —样，也被用于向前方程中.因为概率 
论主要关心的是测度而不是函数，所以就会有这样一个 问题： 为什么我们不从半群 
{ T («)} 而从 Q ⑴出发？答案是有趣的，它有助于阐明向后方程与向前方程之间的 
复杂关系. 

理由是（正如上例所表明的那样)，对于普通的体系，函数空间义中的连续的 
收缩算子半群来自于转移概率：研究我们的半群 Q ( t ) 实际上和研究马尔可夫转移 
概率是一样的.这对测度半群是不正确的.在分析上存在这样的十分合理的收缩半 
群，它不是由马尔可夫过程导出的.例如，考虑直线上的任一形如 (8.8) 的马尔可夫 
半群，只假设绝对连续的 / i 被变成绝对连续的 T ( t ) fi [ 例如，令 r ( t ) 是与方差为 t 
的正态分布的卷积 ] •如果 /i =叫+ M ，， 其中〜是 P 的绝对连续部分，叫是 M 的 
奇异部分，那么我们按如 T 方式定义一个新的半群 

S ⑷/! = r ⑴; ic + / i ,. (8.9) 

这个半群是连续的， 5(0) = 1,但是不难看出，它与任何一个转移概率系统都无关, 
而且它在概率上是无意义的. 

10.9 半群理论的“指数公式” 


10.1 节的伪泊松过程是最简单的马尔可夫过程，现在我们来证明，所有的马尔 
可夫过程实际上都是伪泊松过程的极限形式 .® 这个定理的抽象形式在半群理论中 
起着十分重要的作用，我们现在来证明它实际上是大数定律的推论. 

如果 r 是由随机核 A ： 导出的算子，则由伪泊松分布 （1.2) 诱导的算子 Q ⑷呈 
形式 00 

Q ( t ) = e - at f 2^- Tn ^ (9-1) 

n=0 . 

这个级数定义为部分和的极限.根据査普曼-科尔莫戈罗夫方程 (1.3), 这些算子构 
成一个半群.但最好是重新开始并对任意的收缩算子 T 证明这个断言. 

章中曾讨论过 Q(t) 是卷积箅子这一特殊情形. 
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定理1 如果 r 是义上的收缩算子，那么形如 (9.1) 的算子构成一个连续的收缩半群. 
如果 r 是推移算子，那么 Q ( t ) 也是推移算子. 

证显然 Q ⑷是正的，且 || Q (*)|| < e-^imi < 1•由 Q ⑷和 Q ⑷的级数的形 
式乘积容易验证半群性(见 10.1 节的第2个脚注).由 (9.1), 关系式 Q ( h ) ^ 1是显 
然的. ► 

我们把 (9.1) 缩写为 

Q ( t ) = e Ql(T_1) . (9.2) 

具有这种形式的收缩算子半群称为伪泊松半群①，并且 { Q ( t >} 是由 a ( r - i ) 产生的. 

现在来考虑任意一个由收缩箅子 Q ⑷组成的连续 半群. 在许多方面它和实值 
连续函数有类似的性质，第7章所叙述的、利用大数定律的逼近理论可以不经重大 
改变地搬 过来. 特别是我们将说明， 7.1 节例 （ b ) 的方法可以导致一般半群理论的 
一个重要公式. 

对于固定的 h >0 , 我们定义算子 

Q h ( t ) = e -^ h f ^ ^- Q ( nh ), (9.3) 

可以把它们看作是通过把 Q ⑴中的参数 t 随机化得到的算子、与 （9.1) 相比较可以 
看出，⑷构成一个由 [ Q (/»)- l 】 A 产生的伪泊松半群.现在我们来证明 

Q fc («) - Q ( t ), t -*0. (9.4) 

因为这个结果非常重要，所以我们把它叙述为 

定理 2 每个由收縮算子 Q ⑷构成的连埃半群都是由自同态 fc — 1 ( Q (/») - lj 产生的伪 
泊松半群 { Q h ( f )} 的极限 (9.4). 

证 出发点是恒等式 

Qh ( t ) u - Q ( t)u = e ~ th f ^ ( th :) n lQ ( nh)u - Q ( t ) u ]. (9.5) 

选取这样的 <5, 使得对于0 < « < i , || Q ( a )«- u ||< e . 于是由 (8.7) 我们有 

|| Q ( n/»)u - 0( t)«ll < e , |nft - tl < rjt . (9.6) 

(9.5) 中出现的泊松分布的期望与方差均为 f A . 利用切比雪夫不等式估计满足 | nft - 
的诸项的和，我们得到 

|| Qfc ⑷ u - Q ⑴ u || < e + 2|| u || tM 3 . 

①存在形如的收*算子半鮮，其中 S 不是形如 a ( T - l ) 的自同态.如果 a(x) 是有界的，薄么 
与 10.3 节跳跃过程的解相联系的半 屏就是 这样的半群. 
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由此推出 (9.4) 在有限的 f 区间中一致地成立. ► 

用其他的无穷可分分布代替泊松分布可以得到本节的等价变形.由笫1卷 12.2 节我们 
知道，集中于整数 n > 0上的无穷可分分布{心⑴}的母函数具有形式 

5 Z ⑷ C " = exp ( ta [ p ( C ) - 1)), (9.7) 

其中 

p ( C )= Po + Px < + ---, Pi>0, SPi = 1. (9.8) 

假设分布 {««(«)} 的期望为 W , 有限方差为 ct •在 (9.3) 中把泊松分布换成 { u „( t /6)}, 我们 
得到算子 

Q h ( t ) = (点) Q ( n / i ) = Eu „ (点) Q "( h ). (9.9) 

和上述证明中-样，应用大数定律可以证明当 h - 0时 Q h ⑴ — Q ( t ). 这样，我们得到了 
另外指数公式”，其中 {« n ( t )} 起着泊松分布的作用 .® 

为了看淸这个论证的概率内容和可能的推广，用 X ⑴表示半群为 { Q ( t )> 的马尔可夫 
过程的变 ft , 用 r ⑴表示具有取从 {« n ( t )} 的独立增量过程的变量.算子 (9.9) 相应于变置 
x { hT { k )) 膽賴寒购娜，細弓进卜+麟 W 从肩挪 * ra 翻城 
定律似乎 应有， 当/« — 0时，新过程的分布趋于原来的马尔可夫过程的分布.这种逼近方 
法决不是只对整值变置 r ⑴有效.实际上，我们可以把 { T ( t )} 取为任一使得 E ( r ⑴）= w 
且方差存在的具有正独立增量的过程. 

因此，给定的马尔可夫过程 { x ( t )} 作为变量为的从肩马尔可夫过程的 
极限出现. 

重要的是退近半群的构造可能比原来的半群的构造简单得多.亊实上， (9.9) 的 算子仏 ( t ) 构 
成的半群是简单的伪泊松型半鮮.为了看淸这一点，令 

Q # = p ( Q ( fc )) = £ PnQ n {h) = f ； p n Q ( nh ). (9.10) 

nsO n=0 

这是推移算子的混合，从而它本身是一个推移算子.于是比较 （9.7) 和 （9.9) 可得，在形式上 

Qh (0 = exp ^( Q # - 1), (9.11) 

它确实具有 (9.2) 的形式.不难用初等方法来证实 (9.11), 但是我们将会看出，它实际上是 
从厲半群的生成元公式的特殊情形（见 13.9 节例⑻). 


①这是由钟开莱指出的（见 7.5 节). 
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10.10 生成元，向后方程 


考虑由算子 a = a ( T - l ) 产生的伪泊松型的收缩半群这个箅子是自 
同态，所以 iiu = v 对所有的有定义，并且 



ft —0 + . 


( 10 . 1 ) 


如果这对所有的半群都成立，那就太好了，但这一般是不成立的.例如，对与布朗 
运动相联系的半群，扩散方程 (4.1) 蕴含对于二次连续可微的 u .( lO . l ) 的左边趋于 
\ u ", 但是当 u 不可微时，极限不存在.然而扩散方程仍唯一地确定了这个过程，因 
为半群由它对二次连续可微函数的作用所决定.因此，我们不应该希望 （10.1) 对所 
有的函数 u 成立，但是为了一切实际的目的，只要它对于充分多的函数成立就行 
了.考虑这一点.我们引入 

定义如果对于义中的某些元素 u , w , 关系式 (10.1) 成立(在一致收敛的意义下)，那 
么我们设 w = 这样定义的算予称为半群 { Q ( t )} 的生成元®. 

用 Q ⑷乘 (10.1), 我们看出它蕴含 

( 10 . 2 ) 

因此，如果 ih * 存在，那么所有函败 Q ⑴ u 都在 U 的定义域内，并且 

翌十 1 二 Q “) u — Q ( t)Uu = UQ(t)u. (10.3) 


从本质上讲，这个关系式和马尔可夫过程的向后方程是一 样的. 事实上，沿用 10.4 
节的记号，我们应令 

«(*.*) = Q ⑷ tio ⑻， 

其中 1 X 0 是初始函数.那么 (10.3) 变为 

學， *). (10.4) 

这是熟知的向后方程，但应当正确地解释它.10. 4 节中扩散过程的转移概率非常光 
滑，对于所有的初始连续函数《0,向后方程都是满足的.一般来说却未必如此. 

例 （ a ) 平移 .令幺 由直线上的在无穷远处等于0的连续函数组成，设 Q ⑺ uOc ) = 
u(x + t ). 显然，为使 (10.1) 成立，当且仅当 u 的导数 u ' 连续且在无穷远处等于 0. 
在这种情形下 ， ilu = u \ 

①第9章对卷积 半屏的 讨论,于考虑无穷可徽的函数，因而所有的生成元*定义在同一区域上. 
对于一般的半群，没有这样方便的方法可用. 
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在形式上向后方程 (10.4) 可化为 


当 t = 0时，化为给定的初始函数 uo 的形式解为 u { t , x ) = «o = (t + x ). 但这只有 
当是可微的时候才成立. 

例 （ b ) 与在 10.2 节中一样，考虑变 M 为 X ( t ) 的伪泊松过程和另一个由 X *( t ) = 
X ( t )- ct 所定义的过程.相应的半群有一个明显的关系，即 Q # ⑴《在； t 点的值等 
于 Q ⑷ u 在 z + cf 上的值.对于生成元来说，这意味着 

U#=H-c^, (10.6) 

因此 U # 的定义域局限于可微 函数. 当初始函数 U () 有连续的导数时，向后方程是 
满足的，但对任意的函数不一定是满足的.特别，转移概率本身不一定满足向后方 
程.这说明了旧式理论的困难 | 曾在 9.2 节 (2.14) 中讨论过 j 以及为什么我们要引 
入不自然的正则性条件来推导向前方程. ► 

生成元这个概念的用途应归功于下列 事实： 对于每个由收缩算子构成的连蟥 
半群，生成元难一地决定半群. 这个定理的简单证明将在 13.9 节中给出. 

这个定理使我们能够在没有不必要的限制下讨论向后方程并大大简化它们的 
推导. 因此，当我们亊实上不知道生成元确实存在的情况下，就无法导出 10.4 节第 
3个脚注所提到的扩散算子的最一般形式. 



第 11 章更新理论 

更新过程是在 6.6 节中引入的并在 6.7 节中举例说明过.我们现在从所谓的更 
新方程的一般理论开始，更新方程经常出现在许多领域中 .11.8 节的极限定理为一 
般更新定理的适用性提供了一个极好的例子 • 11.6 节和 11.7 节包含某些渐近估计 
的改进和推广形式，这些估计原来是用高深的分析方法很费力地推导出来的.这说 
明利用一般的理论来解一些特殊的难题是很经济的.关于用拉普拉斯变换的方法处 
理更新问题，见 14.1 节 〜 14.3 节. 

许多文献讨论怎样在更新定理中去掉变量为正这一条件，为解决这个难题，已 
花费了不少的梢力.鉴于这个令人难忘的历史， 11.9 节将包括更新定理的一个新的 
大大简化了的证明. 

11.1 更新定理 

令 F 是一个集中于上的分布，即我们设 F (0) = 0. 我们不要求期望存 
在，但由假设的正性，我们可以记 

^ = J 0 y F { d v) = J o [1 - ^(yJldy, (1.1) 

其中 M < oo •当 M = oo 时，我们约定把符号 / i - 1 看作 0. 

本节我们研究函数 ^ 

( 1 . 2 ) 

在； r — 00时的渐近性质.不久就可看到这个问題和下列更新方程的解 Z 的渐近性 
质有密切的 关系： 

Z { x ) = z ( x ) + f Z { x - y ) F { dy }, i > 0. (1.3) 

Jo 

为确定起见，我们认为积分区间是闭的，但现在我们认为2和 Z 在负半轴上为0, 
于是积分限可以换成 _ oo 和 oo , 更新方程可以写成卷积方程的形式 

Z = z + F - kZ . (1.4) 


①如果我们容许在 原点上 有一个貭量为 p < 1 的原子， 禪么不 会发生本质上的变化 ■ (见习 an .) 
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(类似的说明适用于以后所有的卷积 .） 

在 6.6 节和 6.7 节中曾相当详细地讨论了 f / 的概率意义和更新方程的概率应 
用.因此，现在我们将从纯分析的角度进行讨论.但是应记住，在更新过程中 C /( i ) 
等于5^中更新时刻的平均个数，原点也当作一个更新时刻.因此可以把£/看成是 
集中于0^上的测度，区间/ = 3的质量是 U { I } = U ( b )~ U ( a ). 原点是一个单 
位质量的原子，此质童是由级数 (1.2) 中第0项賦予的. 

下列引理只是重新叙述一下 6.6 节的定理1,但为使本节自给自足，我们给出 
了一个新的证明. 

引理对于所有的 <00. 如果 2 是有界的，那么由 

Z { x ) = J z(x — y ) t /{ d2 /}, x > 0, (1.5) 

所定义的函数 Z 是吏新方《(1.3)的唯一的在有限区间上有界的解. 

[ 利用当 a ： < 0时 zOc ) = Z ( x ) = 0这一约定，我们可以把 (1.5) 写成 Z = U-kz 
的形式 .1 

证设队 = F D * + -" + F "*, 选择这样的正数 t 和 r ?, 使 l - FCOsq . 于是 

jf X [l - F(x - y )] U n { dy } = 1 - F < n +1 >*( x ), x >0, (1.6) 

因此 v [ U n ( x ) - U n (x - r )】 < 1.令 n - oo , 我们可得，对于长度< t 的每个区间 
/,!；{/} 因为长度为 a 的任一区间至多是1 + a / r 个长度为 t 的区间的并， 

所以 

U { x )- U ( x - a )^ C a , (1.7) 

其中= (a + T )/( rri ). 因此，对于所有具有给定长度的区间 I , U { I } 是一致有界 
的. 

Zn = Un - kz 满足 Z„ + 1 = z + F - kz n . 令 n 00 , 我们看出 （1.5) 中的积分是有 
意义的，并且 Z 是 （1.3) 的解. 

为了证明它的唯一性，注意两个解之差满足 y = 因此，对 r = 1,2,…， 
也有 x 

V ( x ) = J V ( x - y ) F r *{ dy }, x >0. (1.8) 

但是当 r — oo 时 F *-*( x )- oo , 且因为假设 K 在 03 中是有界的，所以对所有的 
I > 0, V ( x ) =0. ► 

集中于数 A 的倍数上的分布所起的特殊作用妨碍了对更新定理的系统阐述.按 
照 5.2 节的定义3,这样的分布称为算术分布，使 F 集中于 A ，2 A ,. ••上的最大的 A 
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称为 P 的步长.在这种情形下，测度£/是纯原子的，我们用 《 n 表示 nA 的质量. 
第1卷 13.1 节中的更新定理说明 — A // i . 下列定理®把这个结果推广到了集中 
于0^5上的任意 分布. 为了完整起见，重新叙述了算术分布 F 的情形.（注意，如 
果 M = o °， 则就约定 ) 

更新定理（第一形 式). 如果 F 不是算术分布，那么对于每个 / i >0, 

U ( t ) - U(t - h )-* h / n , t — cx >. (1.9) 

如果 F 是算术分布，那么当 ft 是步长 A 的倍數时，上式也成立. 

在证明这个定理之前，我们利用更新方程的解 （1.5) 的渐近性质来重新叙述它. 
因为可以把给定的函数 z 分解为它的正部和负部，所以我们可以假设 z > 0.为了 
确定起见，我们首先假设尸不是算术分布，且期望 M < oo . 

如果对于0 < a < a ; < & < ooy ( a :) = 1, 对于； t 的其他值 ， 2 (*) = 0, 则我们从 
(1.5) 得到 

Z ( t ) — U(t — o) — U(t — b)—*(b — a )/ n , t —* oo . (1.10) 

这个结果可立即推广到有限阶梯函数 I 令 A , …，各是正半轴上的长度为 L u --- y L T 
的不相交的区间，如果2在 A 取值 a fc ，在 / fc 的并集之外等于0,那么显然 

Z ( t ) n ~ 1 ^ a k L k = M -1 / z ( x ) dx . (1.11) 

fc=i Jo 

由于古典的黎曼积分是通过有限的通近阶梯函数来定义的，因此似乎应有^当2是 
黎曼可积函数时，极限关系式 （1.11) 成立.为了弄淸这个问题，我们回忆一下 2 在 
有限区间0 < a : < a 上的黎曼积分的定义.只要考虑把这个区间分成有相同的长度 
h = a / n 的子区间的分划就 行了. 令 m * 和？ R * 分别是满足下式的最大数和最小数， 

21 * < *(*) < m / b , ( k - l ) h^x < kh . (1.12) 

应当记住 Si fc 和而对的明显的依 赖性. 对于给定的步长？ i , 下黎曼和与上黎殳 
和定义为 

2 = ftSia *, o = hSfrik - (1.13) 

① P. 厄尔多斯 （Erdfie)、W. 费勒和波拉德 （H. Pollard) 在1949年证 S 了离散的情形.他们的证 
明立«被布莱克韦尔 （P. Blackwell) 推广了.现在的证明是 新的. 关于向不集中于0^上的分布 
的推广 JE 11.9 节.向另一个方向的童义深远的推广包含于 Y. S. Chow and H. E. Robbing, A 
renewal theorem for random variables which are dependent or non-identically distributed. 
Ann. Math. Statist., vol. 34(1963) pp. 390-401. 
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当 h -*0 时2和厅都趋于有限的 极限. 如果 ^-2-0, 那么这两个极限是相同 
的，就用这个共同的极限来定义 z 的黎曼积分.每个除了跳跃点以外都连续的有界 
函数在这个意义上都是可积的 • 

当积分在 W 上进行时，古典的定义引进了可以避免的复杂化.为了使可积 
函数类尽可能广泛，照例把0^5上的积分定义为在^上的积分的极限.为使非 
负连续函数2在这种意义下是可积的，当且仅当它的图形与 I 轴之间的面积是有 
限的，遗憾的是这并没有排除的实际振动以及当 a ： — oo 时 2 (*)为 oo 的可 
能性.（见例 a ) 如果给定的函数 z 剧烈地振动，那么解 Z 将趋于有限极限这个假设 
是不合理的.换句话说，复杂的标准定义使很多函数成为可积的 • 为了我们的目的， 
最好用原先的定义推广到无穷区间这样自然的方式进行讨论_因没有既定的术语， 
我们称之为直接积分，以表示它与通过有限区间取极限的间接办法有所不同 • 

定义 A 數 z 彡0 称为直接 黎曼可 积的，如果在 (1.12) 〜 (1.13) 中定义的上、下 黎曼和 
是有限的，且当/» — 0时趋于同一极限 • 

这个定义对有限区间与无限区间不加区别.容易看出，如果2在毎个有限区间 
0^上是可积的，并且对某个< oo , 那么2在5^5上是直接可 积的. （于是对 
所有的 A , 自然有歹<00. ) 正是这个性质排除了剧烈振动的可能性 • 

我们可以用逍近阶梯函数来重新叙述这个定义，对于固定的 h > 0,当 （fc - 
1)/»彡 a : < fc/i 时，设 z k ( x ) = 1,否则设 z k ( x ) = 0. 那么 

Si = J = TmicZk (1-14) 

是两个有限阶梯函数，且4 < 2 < I Z 的积分是当 h — 0时这些阶梯函数的积分的 
共同极限.用 A 表示对应于办的更新方程 的解. 那么对应于5和5的解为 

Z , = HZkiUff . Z = (1.15) 

由更新定理，对毎个固定的 fc 有 Z k { x ) - h / n . 此外， (1.7) 保证对于所有的 fc 和 * 
有 Z k ( x ) < C h . 因此， (1.15) 中级数的余部一致地趋于0,从而我们有 

Z ( i ) —► sjfi , Z ( x ) —* a / n , [x —* oo ). (1.16) 

但是昱 < 名彡芝，从而 Z ( x ) 的所有极限值都位于和之间.如果 2 是直接 
黎曼可积的，那么 ^ 

Z ( x ) fi - 1 J z ( y ) dy , * -» oo . (1.17) 

迄今我们假设 F 是非算术分布的，且 M <° o •当 M = ° o 时，只要把看作 
0,这个论证可以照搬 过来. 
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如果 F 是步长为 A 的算术分布，那么 (1.5) 的解 Z 具有形式 

Z { x ) = Sz(x — k \) iik , (1.18) 

其中 - A // i . 我们容易看出，对于固定的 a :, 

Z[x + nA ) —+ A / i -1 z(x + j \), n —* oo , (1.19) 

i=i 

只要上述级数 收敛； 如果 z 是直接可积的，那么上述级数必然收敛. 

我们巳从更新定理推导出了 （1.17) 和 （1.19), 但这些关系式包含更新定理作为 
它们的当2是区间 U 的示性函数时的特殊情形.因此，我们证明了如下的 
更新定理（另一形式) .® 如果 z 是直接黎曼可积的，那么更新方程的解2当 F 是砟 
算术分布时满足 (1.17), 当 F 是步长为 A 的算术分布时满足 (1.19). 

人们也许会问：是否至少对于在无穷远处趋于0的连续函数 2, 可以去掉直接 
可积性这一条件呢？下面的例子说明不能这样做 .10.3 节例 （ b ) 将类似地说明更新 
定理对无界函数2可以不成立，即使2在有限区间外等于0也不行.因此在更新理 
论中不能应用非正常的黎曼积分，直接可积性是更新理论的自然基础. 

例 （ a ) 连蠄函教 2 在@上可能是无界的，但是在0^5上是黎殳可 积的. 为了说 
明这一点，对 n = l ,2 r ", 令 2 ( r ») = o „, 并在诸如的区间的并 
集外令 z 恒等于0;在 r » 和 n 土 /»„之间设 2 是线性函数.那么2的图形由面积为 
a n h n 的三角形序列组成，从而 z 为黎曼可积的充要条件是£ 0 „/»„ < 00 ,这并不排 
除 a „ — oo 的可能性. 

例 （ b ) 为了研究直接可积性在更新定理中的作用，只要考虑算术分布 F 就够了. 
因此，我们可以假设测度 t ； 集中在整数上，点 n 的质撤趋于极限从- 1 > 0.因 
此，对任一正整数 n , 我们有 

Z ( n ) = ti „2(0) + « n - i2 ( l ) + ... + uo »( n ). 

现在就取 z 为上例中的满足 o „ = 1的函数，那么 2( n ) 〜 nn ~\ 因此 Z 不是有界 
的.如果如充分缓慢地趋于0,那么这显然也是正确的，因此我们得到这样一个连 
埃可积函數2 的例子， 使得 0(2：) — 0,但 Z (; c ) 却不是有界的. ► 

①我们希望这种形式与上述讨论能结束文歒中流行的可悲的*乱.•广泛利用的参考文歒是下面这篇 
报告 | W. L. Smith, Renewal theory and its ramificationa , J. Roy. Stat. Soc. (Series B), 
vol. 20 (1958) pp. 243-302. 它出现后. Smith 的 1 ■主*更新定理*实际上代替了过去的一切形 
式（它们并不总是正碗的)..这 个主® 定理在 Z 是单调的这个不必要的假设下证明了 （1.17). 史密 
斯 (Smith)1954 年的证明是以维纳的离深的 《 伯 (T^uberian) 定理为#确 的， 1958年的报 音给人 
以这样的印象，即这个曲折的程序比直接化为更新定理的第一形式更为簡单，并且在这个报告中无 
意地丢掉了 z 为有界这个条件.丨关于它的必》性见 10.3 节例 （b). 1 
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11.2 更新定理的证明 

对于算术分布更新定理已在第1卷 13.11 节中证明过了，因此我们假设 F 
是非算术 分布. 为给出证明，我们需要两个引理.（第1个引理将以更强的形式出现 
在 10.9 节的系中 .) 

引理1 设 C 是这样一个有界的一 致连续禹數， 使得对于 -oo < x < oo , C ( x )< C (0). 

如果 

C ( x ) = J \( x - y ) F { dy }, (2.1) 

那么 <(*) = < ⑼. 

证如果取与 F 的卷积，则由 (2.1) 利用归纳法可得 

C ( x ) = ax - y ) F r *{ dy }, r = l ,2,.... (2.2) 

被积函数 < 以0),因此当对于的每个增点 j / 都有 <(- V ) = C (0) 时， （2.2) 在 
x = 0 点才可能成立.根据 5.4 节的引理2,上述的增点所成的集合 S 在无穷远处 
是稠密的.鉴干 （ 的一致连续性，这邃含当 y — oo 时 以 - v ) — C (0). 当 r oo 时 
的质 M 趋 r •集中在 OO 上.因此，对于较大的 r , (2.2) 中的积分本质上只依赖 y 
的较大的值.对于这样的值 ， COc _ V) 接近于以0).因此，令 r — oo , 我们从 (2.2) 
推出以*) = C (0), 这就是我们要证明的. ► 

引理2 设 z 是在@外等于0的连埃函数.相应的更新方《的解 Z 是一致连续的， 
并且对于每个 a ， 

Z(x + a ) - Z { x ) -* 0, x -» oo . (2.3) 

证在一个长度为 h + 26 的区间外，差 2 (* + 6 ) - z [ x ) 等于0,因此由 （1.5) 和 

(1.7), 

\ Z(x + 6 ) - Z ( x )\ ^ C / l + 2 « max | i ：( a : + tf ) - z ( x )\. (2.4) 

这说明，如果 Z 是一致连续的，那么 Z 也是一致连续的. 

现在假设 Z 有连续的导数 〆 ，那么 2 '存在且满足更新方程 

2 \ x ) = z \ x ) + j \\ x ~ y ) F { dy }. (2.5) 

因此，7是有界且一致连续的.令 

lim supZ ; ( x ) = » j , (2.6) 
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Ux) = Z'iU, +x) (2.7) 

定义的函数族 Cn 是等度连续的，并且 

f*+t 

Cn(*) = 2 ； (tn + x) = / Cn(x - »)F{dy}. (2.8) 

Jo 

从而存在一个这样的子序列，使得 Cm 收敛于一个极限 C . 由 (2.8) 推知这个极限 
满足引理1的条件，因此对于所有的*，（'(*) = C ； (0) = I7. 

于是 Z '( tn r + re ) -* TJ 或 


Z(tnr + a ) — Z ( t nr ) —* rja . (2.9) 

因为这对每个 a 都成立且 z 是有界的，所以 T 7 = 0. 同样的论证可用下限来证明 
Z '( x ) = 0. 

_因此，我们对连续可微的2证明了这个引理.但是任意一个连续的2可以用在 
oTH 外等于0的连续可微函数 21 来通近•令&是相应的更新方程的解.于是 

I * ~ Zl \<£ 蓮含 |Z - < C h £, 


从而对于所有充分大的 A \ Z{x + o )- Z { x )\ < (2 C h + l ) e . 因此，对任意的连续函 
数 z , (2.3) 都成立. > 

现在来完成定理的证明就很容易了.如果 J 是区间 a <1^/3,那么我们用 J+t 
表示区间 a + t < a : <卢 + t ■由 (1.9) 我们知道，对每个有限区间 I , U{I + t } 是有界 
的.因此，根据 8.6 节的选择定理 2 ,存在这样的序列 tk -^ oo 和一个测度使得 

U { t k + dy ) -» V { dy }. (2.10) 

测度 k 在有限区间上是有限的，但不集中在 ' d ^±. 

现在令2是一个在有限区间 D 外等于0的连续函数，那么对于更新方程的 
相应的解 z , 我们有 


Z(tk + x ) = f z (- s ) U { tk+x + da } -► f z {- s ) V{x + ds }. (2.11) 

Jo Jo 

由上述弓 I 理推出，测度族 K{i + ds } 与 i 无关，从而与 J 的长度成正比.因 
此 (2.10) 可以写成形式 


U(t k ) - U(t k - h) 7*- 


(2.12) 
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除了因子 1T 1 换成了未知参数 7 且把 f 局限于序列以外，这和更_定理的结 
论 (1.9) 相同.但是，我们对更新定理的另一形式的推导仍然成立，因此当 2 直接 
可积时， OC 

-1 z(y)dy. (2.13) 

函数 z = 1 - F 是单调的，它的积分等于 M. 相应的解 Z 是常数1.如果 M < oo, 
那么函数 Z 是直接可积的， (2.13) 说明# = 1 .当 M = oo 时，我们把 2 截尾，从 
(2.13) 可以推出 7- 1 大于 * 在任意区间5^上的积分，于是 M = %级含 7 = 0 .因 
此 (2.12) 中的极限与序列 {t*} 无关， (2.2) 化成了更新定理的结论 (1.9). ► 


*11.3 改 进 

在本节中我们将说明分布 F 的正则性是怎样导致更新定理的更深刻的形式的. 
这些结果本身并不是令人兴奋的，但是它们在许多应用中是有益的. 

定理1 如果 F 是期望为方差为<7 2 的非算术分布，那么 

0 (3.1) 

更新定理本身只说明 y ⑷〜 这个估计 (3.1) 更深刻.即使在方差不存在 
时，只要把右边换成 oo 它仍 成立. 丨第 1 卷 13.12 节 (12.2) 给出了关于算术分布的 
类似定理 . 1 
证设 

Z ( t ) = U ( t )~ t / n . (3.2) 

容易验证这是对应于 ^ 

= (3.3) 

的更新方程的解.利用分部积分法，我们得到 

乂=盍厂州办} = (3.4) 

因为 z 是单调的，从而是直接可积的，所以更新定理的另一形式断言， (3.1) 是正确 
的. ► 

其次，我们转向更新函数 f/ 的光 滑性. 如果 F 有密度/,那么1/的更新方程 
取形式 x 

U { x ) = 1 + J\(x-y)f{y)dy. (3.5) 


* 本节在初读时可以略去. 
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如果/是连续的，那么形式微分表明 U 有满足如下方程的 导数心 

«(*) = /(*) + / «(* - v ) f ( v )^ y - (3.6) 

Jo 

这是标准形式的更新方程，我们知道当/有界（未必连续）时它有唯一的解.容易 
验证，由 t 

u ( t ) = 1+ / u ( y ) dy , t >0, (3.7) 

Jo 

定义的函数 f / 满足 (3.5). 从而 (3.6) 的解 u 确实是 C / 的密度.因此，作为更新定理 
的另一形式的推论我们得到 

定理 2 如果 F 有直接可枳的密度/,那么 I ；有这样的密度 u , 使得 u ( t ) — 

不直接可积的密度在实际中几乎不发生，但是即使对于它们也可得到某些结 
论.事实上，考虑 F - kF 的密度 

/ a ⑴ = j 。 fit - y ) f ( y ) Ay . (3.8) 

一般来说，/ 3 的性质要比/的性质好得多.例如，如果/ < M , 那么我们由对称性 
得 

h ( t )<2 M [ l - F (^ t )]. (3.9) 

如果 /i < oo , 那么右边是单调可积函数，这邃含/ 2 是直接可积的.于是 u - /是更 

新方程在2 = / 2 时的解，因此我们有 

定理 2 a 如果 F 有有界的密度 / 和有限的期望那么 

u (0-/( t ) — M _1 - (3.10) 

这个结果是难以理解的，因为它说明，如果/剧烈地振动，那么 ti 将以补偿它 
们的形式进行振动.（有关的结果见习题7和习题 8.) 

/为有界这个条件是必不可少的.我们用一个例子来说明这一点，这个例子也 
能帮助我们理解更新定理中的直接可积性条件. 

例 （ a ) 设 G 是由下式定义的集中于0^上的概率分布： 

G ( g ) = ^(e/j)' 0<x<1 - ( 311 ) 

它有一个在开区间上连续的密度，但是因为当 a : - 0时 x ^ Gix ) - 00,所以 
这个密度在原点附近是无界的.如果毎个分量小于 z / n , 则 n 个具有分布 G 的独立 
随机变董之和必然小于 a ：, 因此 


G"* ⑻彡 (G(x/n)) n . 


(3.12) 
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由此推出，对于每个 n , G "* 的密度在原点附近是无界的. 

现在设 F ( x ) = G(x - 1), 那么- n ), 从而 F n * 的密度当 
x < n 时等于0,当 a ; > n 时是连续的，但在 n 附近是无 界的. 因此，更新函数 
U = EF "* 的密度 u 在每个整数 n >0 的附近是无界的. 

例 （ b > 上例中的密度 U 满足 (3.6), (3.6) 与 z = f 时的标准更新方程 (1.3) 一致 • 
这是一个可积函数，当 ; c > 2时它等于0,除了在点1以外它是连续的.解 Z = U 
在每个整数附近无界这个事实说明，如果2不是正常黎曼可积的(有界的)，那么更新 
定理可能不成立，即使 Z 集中在有限区间上也不行. ► 


11.4 常返更新过程 


现在用更新定理来推导在 6.6 节中引入的更新过程的各种极限定理.我们来讨 
论具有共同分布 F 的相互独立的随机变董•(到达的时间间鵑）的序列.在 
本节中，我们假设 F 是一个正常分布， ^(0) = 0. 除了九外，我们可以定义一个 
具有正常分布 lb 的非负整值变董 S 0 . 我们设 


5 n = 5 o + + • • • + r n . (4.1) 

变量称为更新时刻.如果知= 0,那么更新过程{5„}称为純更新过程，否则称 
为延迟了的更新过程. 

我们沿用 (1.2) 中引入的记号1/ = •在中的更新时刻的期望个敷为 
V { t ) = £ P {5„ < t } = FoirU . (4.2) 


因此，对 fc >0, 我们有 ® 


V(t + h )- V ( t ) = f ^ + h [ U(t + h - y )- U ( t - |/)) F 0 { di /}. (4.3) 

如果 F 是非算术分布，那么当 t — oo 时被积函数趋 于 n ~ l h , 于是基本定理也 
可以推广到延迟了的过程：如果 F 是非算术分布，那么在 t，t + & 内的更析时刻的期 
望个数超于这个结论包含两个等分布 定理： 第一，更新速度趋于一个常数; 
第二，这个常数速度和初始分布 无关. 在这个意义下，我们有一个类似于第1卷第 
15 章中马尔可夫链的遍历定理的定理. 


①由 11.1 节我们知道，积分区间是闭的，因此积分限可以换为 _oo 和 oo. 
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如果 /i < oo, 那么当 t — oo 时V ⑷〜 n ~ H . 自然要问，是否可以这样选择 
Fo , 使得 = 此式表示更新速度是常数.因为 F 满足更新方程 


V = F 0 + FirV , 

(4-4) 

所以为使 = 当且仅当 


Fo ( t ) = ^ ^ y (t — y ) F { dy }. 

(4.5) 

利用分部积分法可以证明这和下式相同： 


F 0 ( t ) = j f [1 - F ( y )] dy . 

P Jo 

(4.6) 


这个 F 0 是一概率分布，从而答案是肯定的：对于初始分布 (4.6), 更斬速度是困定 
的， V ( t ) = n ~ H . 

分布 (4.6) 也作为剩余等待时间的极限分布或到达概率出现，对给定的 t > 0, 
有相应的一个依赖于机会的下 标风， 使得 


SN t < 5 at , +1 . 


(4-7) 


利用 6.7 节中引入的术语，变 M S Nt+1 - t 称为在时刻 t 的剩余等待时间.我们用 
H ( t,Q 表示它 <《的概率.换句话说，是时刻 t 后的第一个更新时刻位于 
tj+l 内的概率，即超过水平 t 的贵彡 C 的概率.如果某个更新时刻等于 re < 4, 
且随后的到达时间间隔位于 t - a: 和 t-ar + e 之间，那么上述事件发生.在纯更新 
过程的情形下，对 re 和 n 求和，我们得到 

H ( t ，0 = J o t/{dx}[F(« -x + O-F^-*)], (4.8) 


这个积分包含 C 作为一个自由参数，但它具有标准的形式 Uirz , 其中冲)= F(t + 
0 - F ( t ), 这个函数是直接可积的 .® 假设 F 是非算术分布.因为 



z ( t)dt 


= /°°([l-F(t )]-[ l - F(t + 0 ])dt 

V 

=/ (1 - F ( fl )) d «, 

•/o 


(4.9) 


所以我们有极限定理 


^ 邱，0 = 


[1 - F( a )]ds. 


(4.10) 


①对 n €<: r <( f »+ 1 兄，我们有 *(*) 矣 F((n + 2)0- FK ), 具有这些項的级数显然是收敏的. 
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(容易验证这对延迟了的过程也成立，不管初始分布凡怎样 .） 这个极限定理在几 
个方面是值得注意的.正如下述讨论所说明的那样，它与 6.7 节中的检验悖论及 1.4 
节中的等待时间悖论有密切的关系. 

当/! < oo 时极限分布 （4.10) 与 (4.6) 一致，于是， 如果 /* < oo , 那么剩余等 
待时间有正常的极限分布，这个分布与获得均匀更新速度的分布一致. 在这个模型 
中，我们再次看到了趋于“定常状态”的趋势. 

只有当 F 存在有限的方差时， (4.10) 的极限分布才有有限的期望. 粗略 地说， 
这表明 进入概率的性质要比 F 的性质差. 事实上，当 M = 时，对所 有的^ 我们 
有 

— 0， (4.11) 


即一 个任意大的量《超过水平 t 的概 牟超于 1. (对于正则变化的尾部的情形，更确切 
的信息将在 14.3 节中导出 .） 

例 （ a ) 更新过程的叠加. 给定个更新过程，可以把它们的所有更新时刻组成一 
个序列来构成一个新过程.一般说来，这个新过程不是更新过程，但容易计算出时 
刻0后第一次更新的等待时间我们现在来证明，在相当一般的条件下 ， W 的分 
布是渐近栺數分布， 从而组合过程接近于泊松过程.这个结论说明了为什么许多过 
程（例如打往电话交换台的信号）是泊松型的. 

考虑由到达时刻的间隔的分布 F u - -, F n 导出的 ri 个相互独立的更新过程，这 
些分布的期望为糾,…，知.设 



粗略地说，我们要求每个更新过程的更新时刻是极少的，使得积累效应是由许 
多小的原因引 起的. 为了表达这一点，我们假设对于固定的 fc 和概率凡⑹很 
小，办很大——这是一个在极限定理的形式中很有意义的假设 • 

考虑“定常状态”的情况，即过程巳进行了很长时间.那么对于第 fc 个过程中 
最近的更新时刻的等待时间％,我们近似地有 

P{Wk /V - Fk ( y))dv » —• (4.13) 

^kJo 

[后一近似可由 F k ( y ) 很小这一事实得到 • j 积累过程中的等待时间灰是等待时间 
W k 中的最小者，从而 

PW > t } w (1 -忐)… (1 -士) w e - to . (4.14) 


很容易使这个估计更精确，在上述条件下指数分布作为 n ^ oo 时的极限分布出现. 
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例 （ b ) 随机游动中的到迗慨牟.对于独立随机变量序列 X 2 ,.. •，令 
+ • •' + X n . 


对于正的 X *,随机游动 { Y n } 化为更新过程，但是我们考虑任意的 Xfc . 假设随机 
游动是常返的，因此对于毎个 t > 0,必然有一个 n 使得> t . 如果 TV 是使这成 
立的最小指标，那么以称为首次进入？^的点.变量以 - f 是在首次进入时超 
过水平<的董，它相应于更新过程的剩余等待时间.再设 p { r w < t +^} = H ( t ， o , 
我们来证明剩余等待时间极限定理也适用于这个分布. 

_ Sx 定义为首次进入 w 中的点，根据归纳法，把 S „ +1 定义为首次进入 
中 的点. 序列 ShSa ,* ••和 6.8 节中引入的阶梯高度一致且形成一个更新过 
程：差 5 „+i - 5„显然是相互独立的，且与 So 有相同的分布.因此，实际上 
是更新过程 { S „} 的剩余等待时间，从而 (4.10) 成立. ► 

利用推导 (4.10) 的方法可以证明，已度过的等待时间 t -5 w , 有同样的极隊分 
布. 对于包含 f 的到达时刻的间脒的长度 = S W , +1 - S w ,, 我们得到 

P{it <0= f t /( da:)|nO - 印一*)1， (4.15) 


从而 




1 - F ( v)]dy 

1 / iFidx}. 

Jo 


(4.16) 


这个公式的古怪的含义在 6.7 节中讨论检验悖论时以及在 1.4 节中讨论等待时间的 
悖论时已讨论过. 

容易看出，3个变量族- 和心 都形成具有平稳转移概率的马 
尔可夫 过程. 因此，我们的3个极限定理可以作为马尔可夫过程遍历定理的例子. 
(又见 14.3 节 .） 


11.5 更新时刻的个数 iV t 

为了简单起见，我们考虑纯更新过程，这样第 》• 个更新时刻是 r 个有共同分布 
/的独立变量之和.把原点当作更新 时刻. 我们用 iV t 表示在 6 T * 内的更新时刻的个 
数.为使亊件{风> f } 发生，当且仅当第 r 个更新时刻属于从而 


P{N t >r} = 


( 5 . 1 ) 
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显 然风彡 1. 由此推出， 

EW) = ^PW>r} = f/(t). 


(5-2) 


(关于高阶矩见习题 13.) 

变董风也出现在序贯抽样中.假设抽样 { T n } 连续进行到观察值之和首次大 
于 t 为止.于是 M 表示总的试验 次数. 利用改进的更新定理提供的估计 （3.1), 可 
以避免许多冗长的计箅. 

如果 F 的期望^和方差 a 2 都存在，那么 F "* 是渐近正态分布这个事实确定 
了 N t 的分布的渐近性质.必要的计算可在第1卷 13.6 节中找到，并且不依赖于 F 
的算术特性.因此，我们有一般的 

N t 的中心极限定理 如果 F 的期望是叫方差是 o 2 , 那么对于较大的 t , 更新时刻 
的个數风是渐近正态分布的，其期望为方差为 

例 （ a ) I 型计 數器. 要进入计数器的质点构成一个泊松 过程. 在计数器空闲时到达 
计数器的质点被记录下来，但它使计数器关闭一段时间，这个时间有固定的长度《• 
在关闭期间内到达计数器的质点一点也不起 作用. 为了简单起见，我们让这个过程 
从一个新质点到达空闲的计数器的时刻 开始. 于是我们有2个更新过程.主要的过 
程（要进入计数器的质点流）是一个泊松过程，即它的到达时刻的间隔服从期望为 
c - 1 , 方差为 C - 3 的指数分布1 - 逐次的记录形成另外一个更新过程，其中到 

达时刻的间隔是€与一个指数随机变贵 之和. 因此，两次记录之间的等待时间的期 
望为 f + c — 1 , 方差为 c - 2 . 于是在时 间区间 07 内的记录次數是渐近正态的，其期望 
为 Ml + cO - 1 , 方差为 tc(l + cC )- 3 . 

这些量之间的差异说明记录不服从泊松分布.在早期人们不明白记录过程与 
主要过程有本质的差别，因此使一些物理学家得出了错误的 结论： 宇宙线显示器不 
符合具有“完全随机性”的泊松模型. 

为使 N t 的极限分布存在，当且仅当 F 属于某一吸引域.这些吸引域的特征曾 
在 9.8 节和 17.5 节中描述过 • 由此知道， 风 有正常的极限分布，当且仅当 

1 — F(x) ~ x~ a L(x), x — » oo , (5.3) 


其中 L 是缓慢变化的，0 < a < 2. 很容易得到 7 V t 的极限分布，并且这个分布说明 
了振动的自相矛盾的性质.对于 a < 1和 a > 1,性质是完全不相同的. 

考虑0 < a < 1的 情形. 如果这样选择 a r , 使得 

r [ l - F ( a ,.)]-^, (5.4) 



11.6 可终止 （瞬 时）过程 329 


那么 ^(arx) G a {x), 其中 G a 是满足下列条件的单侧稳定 分布： 当： c — oo 
时， x a [l - G«(*)] — (2 - a)/a. (参阅 9.6 节、 17.5 节及 13.6 节 .） 令 r 和 t 这样地 
增加，使得 * ~ 由于£是缓慢变化的，所以我们从 （5.3) 和 (5.4) 得到 


2 -q x~ a 
a 


(5-5) 


从而由 (5.1) 得到 






G a ( x ). 


(5-6) 


这是一个与中心极限定理类似的 定理. a = ^的特殊情形已包含在第1卷 13.6 节 
中. (5.6) 中的正规化因子 1- F ⑴表达了这个出人意料的特点.很粗略地说， 1- F ( t ) 
具有数 M 级广' 从而 M 的可能的数量级是尸，更新时刻的密度必定急剧减少（这 
和到达概率的渐近性质一致). 

当1 < a < 2时，分布 F 的期望 M < 00,同样类型的计算说明 


P^Nt> ^ J- G a (x), (5.7) 

其中 A ( t ) 满足 

f[l - F(A(t))] -> 2 a ° M- (5.8) 

在这种情形下，更新时刻的平均个数是线性增加的，但是正规化因子 A ⑷表明在 
期望的附近的起伏是极为激烈的. 


11.6 可终止（瞬时）过程 


具有亏损分布 F 的更新过程的一般理论几乎没有什么价值.但是相应的更新 
方程常常在各种各样的伪装下出现，这种伪装具有能掩盖一般背录的特点.清楚地 
理解这个基本事实可以在各种应用中避免麻规的论证.特别，利用定理2的渐近估 
计可获得原先由著名的维纳-霍普夫 ( Wiener - Hopf ) 方法的特殊修正推导出的结 
果. 

为避免记号的混乱，我们把基本分布 F 换成 L . 因此，在本节中 L 表示满 
足 1(0) = 0和 L(oo) = Loo < 1的亏損分布.它作为（亏损的）到达时刻间隔巧的 
分布，亏量 1 - Loo 表示终止概率.把时间轴的原点当作第 0 个更新时刻， 5 n = 
+ • • • + r „ 是第 n 个更新时刻，它是一个分布为 L "* 的亏损变量，分布的总质 
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量 L "*( oo ) = LSc 亏量1 - LSo 是在第 n 个更新时刻前终止的概率.我们又设 

U = ( 6 . 1 ) 

和常返过程中一样， U ( t ) 等于在 5 T * 内更新时刻 的期望个數， 但是现在所有的 
更新时刻的期望个数是有限的，即 

U { oo ) = Y ~ l ~' ( 6 - 2 ) 

第 n 个更新时刻是最后一个更新时刻，且< a ： 的概率等于 （1 - ioo ) i n *(*) .因 
此，我们有 

定理1 从原点开始的瞬时更新过程以概■年1 终止. 终止时刻 M (即序列0, Si ，灸，…达 
到的最大值)有正常分布 

P{M < i > = (1 - ioo ) l /( i ). (6.3) 

第 n 个更新时刻是最后一个更新时刻的概率等于 （1 - Loo )^, 因此更新时刻的个 
数服从一个几何分布. 

可以用下列（亏损的）更新方程来表达上述这些 结果： 

2⑷ =* ⑴+ /卵 - i /) L { dy }， (6.4) 

但是对于亏损的这个理论是不足道的.又假设对 i <0, z ( x ) = 0 , 则唯一解为 
Z ( t ) = j \( t - y ) U { dy ). (6.5) 

若在 t oo 时 z ( t ) -► z ( oo ), 则显然有 

( 6 - 6 ) 

例 （ a ) 如果过程在 So 上终止， 或者如果7\ 取某一正值 y < t 且剩余的过程的寿 
命< t - y , 那么事件 {M < t } 发生. 因此， Z ( t ) = P { M < t } 满足更析方程 

Z ( t ) = l-Loo + jr Z ( t - y ) L { dy }, (6.7) 


这等价于 (6.3). 



_ 11.6 可终止 （瞬 时） 

例 （ b ) 矩的计算. 上述方程把正常分布 Z 表示为2个亏损分布（即 一个卷 积与一 
个在原点有一个原子的分布）之和.为了计算 Z 的期望 ，令 

El = f xL { Ax ). (6.8) 

Jo 

对于其他的分布是类似的，不管分布是不是亏损的.因为 L 是亏损的，所以 (6.7) 
中的卷积的期望为 Loo - Ez + El . 因此，= E l /(1 - Loo ). 对于更一般的方程 
(6.4), 我们可以同样的方式得到 

e. Ez + El , c 

Ez = - m ^- _ 

可以用同样的方法计算高阶矩. ► 

渐近估计 

在应用中2 ⑴ 通常趋于一极限 z ( oo ). 在这种情形下， z ( t ) 趋于由 (6.6) 给出的 
Z ( oo ). 得到差 Z ( po )- Z ( t ) 的渐近估计常常是很重要的.这可以用一个在随机游动 
理论中具有广泛适用性的方法来得到丨见 12.4 节例 （ b ) 中的相伴随机游动 1. 它依 
赖于下述（通常是无害的） 假设： 存在一个数 t 使得 

J^e^Lidy} = 1 . ( 6 . 10 ) 

这个根 fc 显然是唯一的，由于分布 L 是亏损的，所以 k >0. 我们现在用 

L # { di /} = e fcB L { d »} (6.11) 

定义一个正常概率分布 L # . 对于毎个函数/,定义一个新函数 
/ # { dy } = e ^ L { dy } 

与它对应.由 (6.4) 可知，更新方程 

Z *{ t ) = z * ⑹ + j Q y)^*M (6.12) 

成立. 于是，如果 Z *( t ) — a 衿0,那么 Z ⑷〜 ae - fct . 因此，如果是直接可积的 
[ 在这种情形下 2( oo ) = 0], 那么更新定理蕴含 

e - w Z ( t ) — X °° e ^ ztxjdx , (6.13) 

H *= r ^ vL { dy }. 

Jo 


其中 


(6.14) 
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在 (6.13) 中我们得到了 Z ( t ) 对较大的 t 的一个良好的估计. 

稍微作一下修改，这个程序也可适用于 ^( oo )^ O 的情形. 

令 

21 ⑺= 2(00) - Z ( t ) + 咖) 々:/⑴ . 

容易验证，差 Z ( oo )- Z ( t ) 满足把2换成 21 的标准更新方程 (6.4). 简单的分部积 
分说明， zf { x ) = Zl ( x ) e kx 的积分由 (6.15) 的右边 给出. 因此，把 (6.13) 应用于 2l , 
我们得到 

定理2 如果 (6.10) 成立，那么更析方程的解满足 

l Z ( oo )- Z (1 )]-^ ( 615) 

+ / o °° eKoo ) - z ( x )] dx , 

只要 / i / oo 且 2 i 是直接可积的. 

对于特殊情况 (6.7), 我们得到 

P{M > t } 〜 (6.16) 

在下一节中将说明这个估计的惊人的威力特别，例 （b) 说明我们的简单方法 
有时可迅速导致过去常常需要高深且费力的方法才能得到的结果. 

1*00 > 1的情形.如果 Loo > 1,那么存在一个这样的常数*<0,使得 (6.10) 成 
立，上述变换把积分方程 （6.4) 化成 (6.12). 因此，利用更新定理可导出 Z ⑷的 
渐近性质的精确估计 .[ 离散的情形包含于第1卷 13.10 节的定理1 中. 关于在人口 
统计学中的应用，见第1卷 12.10 节例 （ e ). j 


11.7 各种各样的应用 

正如我们巳经指出的那样，上节的理论可以应用于在概念上与更新过程无直 
接关系的问题，在本节中我们给出2个独立的例子. 

例 （ a ) 克拉美的破产估计在 6_5节中曾指出，复合泊松过程中的破产问题和储 
存设备、病人治疗时间表有关的问题都依赖于一个集中在0^5上的概 芈分布 这 
个 分布满足积微分方程 

纪⑷= ~ R {, z ) 一 7 / R ( z ~ (7.1) 

c . c j 0 
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其中 F 是一个正常分布 .® 在旧上积分（7_1)并进行明显的分部积分，我们得到 

R ( t )~ R (0) = - [ R { t - x )[ l - F ( x )]4 c . (7.2) 

c Jo 


此处 R (0) 是一个未知常数，但否则的话 (7.2) 是一个带有亏损分布 L 的更新方程, 

的密度为 a / c[l - F { x )}. 如果以 m 表示 P 的期望，那么 i 的质 董等于 = a / i / c . 
[ 只有当 ioo < 1时，这个过程才有意义，因为否则对于所有的 t , R ( t ) = 0 .] 注意 
(7.2) 是 （6.4) 的特殊情形，并且 R ( oo ) = 1. 回忆 （6.6), 我们可得 

⑼ = 1 - om/c, (7.3) 

利用这个值，积分方程 (7.2) 化成，该过程的到达时刻间隔分布为 L 的可终止过程 
的寿命 M 的分布的形式 （6.7) .由 (6.16) 推出，如果 存在一个常數 fc , 使得 

^ 厂 e ** 【1 - F ( i)]dx = 1 (7.4) 

和 

/ x # = - / e fcx i[l - F { x))<ix < oo , (7.5) 

c Jo 

那么当 t —♦ oo 时 

1 -邱 卜忐 ('-f )«'**. ㈣ 

这是原先用高深的复变数方法导出的著名的克拉美估计 . fl 的矩可用 11.6 节例 （ b ) 
中所述的方法去计算. 

例 （ b > 泊 松过程中的间 隔在6. 7 节中我们对于更新过程中第一个长度 X 的间 
隔的等待时间的分布 K 导出了更新方程.当更新过程是泊松过程时，到达时刻的间 
隔服从一个指数分布， 6.7 节 （7.1) 更新方程具有标准形式 V = z + V - kL , 并且 


厶 ㈤ =1 - e -ca . ^( x ) = 0, 当 ; r < f 时， 

L ( x ) = 1 - e -枝 ， z ⑻= e -故 ，当 * 彡 f 时. 


因为 ^( oo ) = 1- £ oo , 所以正如这个问題所要求的那样，解 F 是一个正常分布. 
等待时间 W 的矩容易用 11.6 节例 （ b ) 所述的方法来计算.我们得到 



Var(W0 


e 2 ^ - 1 - 2c$e c « 


(7.8) 


①这是 6.5 节 (5.4) 的特殊情形，此时 F 集中于 0T55 上.在 14.2 节例 （b) 中将应用拉普拉斯变挟来 
讨论它.一般情形将在 12.5 节中研究. 
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如果我们把看作 行人为穿过车流所需的等待时间，那么这些公式揭示了一 
个不断增加的车流速度的作用.在穿过时间中汽车的平均数目是泛.取夂=1,2, 
我们分别得到 E ( W ) w 1.7托和 E ( W ) « 3.2^. 方差大约从 f 增加到时 2 . 丨 关于显 
式解及其和覆盖定理的关系，见 14.2 节例 （ a ).] 可应用渐近估计 (6.4). 如果敁> 1, 
那么方程 (6.10) 化成 

ce ( K - c >« = k , 0< «< c . (7.9) 

通过计算，我们从 (6.14) 得到 

1 - V ( t )~ \~ K ’: e_ Kt (7.10) 


11.8 随机过程中极限的存在性 

最能说明更新定理的威力的大概是这样一个事实，即更新定理能使我们很容 
易在很大一类随机过程中推导出“定常状态”的存在性.关于过程本身，我们只需 
要假设所讨论的概率是完全确定的，否则定理是纯分析的 .® 

考虑一个具有可数多个状态说 ，玢， …的随机过程，用 P fc ( t ) 表示 E k 在时刻 
« >0时的概率.下列定理依赖于“循环事件”的存在性，即依赖于使过程重新开 
始的时刻的存在性.更确切地说，我们假设以概率1存在一个时刻负，使得过程 
在负以后的部分是从0开始的整个过程的概率复 制品. 这蓮含具有同样性质的时 
刻5 2 , S 3 ，… 的存 在性. 序列{5„}形成一个常返更新过程，我们假设平均循环时间 
只= E (50 是有限的.我们用 P fc ( t ) 表示在给定负= a 下状态 E k 在时刻 f + «时的 
条件概率.假设这些概率与《无关.在这些条件下，我们来证明一个重要的 
定理 

( 8 . 1 ) 

存在，其中 P* > 0, Ep* = 1. 

证令 Qk(t) 是-负> t 且在时刻 t 系统处于状态私”这个事件的概率，于是 

f^q k (t) = l-F(t), (8.2) 

fc=o 

其中 F 是循环时间 S n+1 -S n 的分布.根据假设 

汽⑻= « fc W+ fPk(t~ j/)F{dy}. (8.3) 

Jo 

①关于更复杂的结果，见 V. E. Bene§, A "renetoaf limit theorem for general 4toch<utic proceaaea, 
Ann. Math Statist, vol. 33(1962) pp. 98-113, 或他的书 (1963). 
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函数％是直接可积的，因为它由单调可积函数1 _ F 所控制.因此，根据第二更新 
定理， 0 O 

t liin Pfc ( t ) = ^J Qk{t)dt. (8.4) 

(8.2) 的积分表明，这些极限相加等于1,从而定理得证. ► 

值得注意的是，在证明极限 (8.1) 的存在性时，我们并没有用到计算极限 (8.1) 

的方法. 

注 如果凡 是正常分布，那么 (8.1) 蕴含 

f Pk(t-y)F 0 {dy}-^P k , 当 t — oo 时. (8.5) 

Jo 

因此，本定理也包含延迟了的更新过程 {«„} 的情形，其中 S 0 有正常分布凡. 

例 （ a ) 排队论.考虑由一个或几个“服务员”组成的设施（电话交换台、邮电局或 
一 个计算机的部件)，并令状态表示在这个设施中有 fc 个“顾客”.在大多数模 
型中.当到来的顾客看到系统处于状态说时，过程重新开始.在这种情形下，为使 
我们的极限定理成立，当且仅当这样的时刻以概率1发生，并且其期望是有限的. 
例 （ b > 两级更斩过程，设有两个可能的状态 E u E 2. 最初系统处于玢.在玢上 
逐次逗留的时间是具有共同分布朽的随机变世它们与在扮上的逗留时间 
相互交替，这些 K 具有相同的分布丹.照例假设所有的变童是独立的，我们就得 
到了一个到达时刻的间隔分布为 jr = Flif p 2 的嵌入更新 过程. 假设 E (^) = mx < 
oo , E ( i 9) = / i 2 < oo . 显然 9 l ( t ) = 1 - F 1 (t), 因此当 t - oo 时，的概率趋于极限 

Pi{t) = ——» Pi(t) = ~~— • (8.6) 

Ml + M 2 Ml + M 2 

这个论证可推广到多级系统. 

例 （ C ) 第1卷第17章中的微分方程对应于一些随机过程，其中向任一状态的逐 
次返回形成一个所要求的类型的更新过程.因此，我们的极限定理极限概率的存在 
性. 利用把导数换成0的微分方程很容易得到它们的显式 •[ 例如见第1卷 17.7 节 

(7.3) . 我们将在 14.9 节中更系统地讨论这个问理.同样的论证也适用于 14.10 节的 

习题14所述的半马尔可夫过程 .j ► 

*11.9 全直线上的更新理论 

在本节中我们将把更新理论推广到不集中于一条射线上的分布上.为避免不足 
道的情形，我们假设 F {^0}> 0,F{0^S} > 0,并且 F 是非算术分布.类似于 
第一节，对算术分布所需要做的修改是显然的. 


* 后面用不到本节的内容. 
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由 6.10 节我们知道，分布 F 是瞬时的，当且仅当对于所有有限区间， 

U { I } = '£ F n *{ I } (9.1) 


是有限的.否则对于毎个区间， U { I ] = oo , 此时称 F 是常返的.对于瞬时分布有这 
样一个问题： 11.1 节的诸更新定理可以搬过来吗？这个问题引起了许多数学家的兴 
趣，这与其说是由于它本身的重要性，倒不如说是由于它的意想不到的困难.因此， 
更新定理被布莱克韦尔 （ Blackwell ), 钟开莱，钟开莱和波拉德，钟开莱和华尔夫维 
茨， Karlin 和 Smith 逐步推广到了各种特殊的瞬时分布，但一般的定理是费勒和奧 
雷 （ Orey ) 在1961年利用概率工具和傅里叶分析工具证明的.下述证明是相当简单 
且比较初等的.事实上，当 F 的期望有限时， 11.2 节给出的证明可以毫不改变地搬 
过来.（关+平面内的更新理论，见习题 20.) 

下文中将用到这样一个事实，期望^ # 0的分布是瞬时的（见 6.10 节的定理 
4). 照例，/ + f 仍表示把/平移*后所得的区间 • 

一 般的更新定理 （ a ) 如果的期望 / x >0, 那么对于每个长度为 / i >0 的区间八 


U{I -\- t } ― ► —, t ― * oo , 

(9-2) 

l /{/ + i } — ► 0, t ― ► — oo . 

(9.3) 


( b ) 如果 F 是瞬时的且期望不存在，那么对于每个有限区间当 t — ± oo 时， U{L 


+ 1 } — » 0 . 


今后我们认为， F 是瞬时的，2是在有限区间 _h < X < h 外等于0的连续函 
数，且 o 0. 

在证明定理之前，我们回忆一下曾在 6.10 节中证明过的几个亊实. 

由 


Z ( x ) = J z ( x - y ) U { dy } 


(9-4) 


定义的卷积2 = U - kz 是完全确定的，因为实际的积分区域是有限的.根据 6.10 节 
的定理2,这个 Z 是一个连续函数，且满足更新方程 


Z = z + FirZ , 


(9-5) 


而且么在使得 2(0 > 0的点$上取得极大值. 

T ^ U „ = F °* + ■■■ + F"*. (9.5) 的每个非负解2满足 Z >名= Uo - kz , 从而由 
归纳法有2 > U n * z . 由此推出，在对于任一其他的非负解 A 都有 Zi > Z 的意 
义上，解 (9.4) 是最 小的. 因为石= Z + const 也是解，所以 


lim infZ(i) = 0, x — » ±oo. 


(9-6) 



引理 1 对于每个常數 a , 
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Z(x + a ) — Z ( x ) —♦ 0, x —* ± oo . (9.7) 

证证明和 ll . 2 节引理2的证明相同，在那里我们利用了这样一个事实，即卷积 
方程 


C = ^C (9.8) 

在 a ： = 0点达到最大值的有界一致连续解是一个常数.这对不集中上的分布 
也仍然是正确的，证明实际上更简单，因为现在由 i ^ F 2 *， •.的 增点构成的集合 i ； 
是处处稠密的. ► 

虽然我们以后不明显地利用它，但我们仍给出下列有趣的 
系® (9.8) 的每个有界连埃解是一个常数. 

证如果€是一致连续的，耶么可以不加改变地应用引理1的证明.如果 G 是一 
个任意的概率分布，那么& = GM 也是 (9.8) 的解. 我们可以选择这样的 G , 使得 
6有有界的导数，因而是一致连 续的. 特别，4与任意正态分布的卷积是一个常数. 
令 G 的方差趋 T 0,我们看到€本身是一个常数. ► 

期望存在时更新定理 的证明当 0 < m < oo 时，只要把 11.2 节的证明作一个不足 
道的改变就 行了. 在最后的关系式 （2.13) 中，我们利用了试验函数 z = 1 - 对此 
函数，解 Z 化成常数 1. 现在我们改用 

2 = F °*- F . (9.9) 

对于它 U n -kz = F °* - 因此 p > 0,所以显然有 Z = F 0 *. 

应该注意到，当 /i = + oo ( 这意味着: rF { d ; c } 在0^3上的积分发散，但在=53^5 
上的积分收敛）时，仍可应用这个证明. ► 

当期望不存在时，证明上述定理需要更精细的 分析. T 列引理说明只要对一个 
尾部证明这个断言就够了. 

引理2倣设期望不存在，并且 

U { I - t }->0, t — + oo , (9.10) 

那么也有 

U{I + t } — ► 0, t — » + c ». (9.11) 

①这个系对任意詳上的分布都成立.见 G. Choquet and J. Deny, C. R. Acad. Sd. Paris, vol. 
250 (1960) pp. 799-801. 
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证我们利用 11.4 节例 （ b ) 中关于由 F 支配的随机游动的到达概率的结果.用 
H ( t ，0 表示首次进入^发生在 t 到 f ( 之间的概率.区间 J + <关于 * + ： r 所占 
的位置与 J -2： 关于 t 所占的位置相同，从而 


u { i + t }= r H ^) u { i -^}. 

Jo 

(9.12) 

考虑随机游动的第一步，我们看到 


1- 丑(0,0彡 1- F (0. 

(9.13) 

我们已经知道，如果 / i < oo 或 m = 即如果右边在 W 上是可积的，那么这个 

断言是正确的.否则 H 的期望是无限的，从而对于每个当* — oo 时 
因此，对于较大的 t , 实际上只有较大的 C 起作用，并且对于这些 C 的值， t / U -0 
很小.于是 （9.11) 是 （9.10) 和 (9.12) 的直接 推论. ► 

引理3 饭设 Z (: c ) < m , 并选择这样的 p > 0,使得 〆 =1 - pm > 0. 对于给定 
的€>0,存在这样的 s t , 使得对于3>««,或者 

Z ( s )< e , 

(9.14) 

或者对所有的 a ：, 

Z(s + 1 ) > pZ ( s ) Z ( x ). 

(9.15) 

证由 Z 的一致收敛性和引理1,我们可以选择这样的使得当 
时， 

Z(a + x ) — Z ( x ) > — ep '. 

« > 8« 且 |®| < ft 

(9.16) 

令 

V .{ x ) = Z(a + *)- pZ ( a ) Z ( x ), 
v ,( x ) = Z(s + x ) — pZ ( a ) Z ( x ). 

(9.17) 


Vs 满足更新方程= V t +Firv a , 并且由引理1之前的说明可知，如果 V ；取负 
值，那么它在使 v (0 < 0的点$上取得最小值， 从而旧 < /». 于是由 (9.16), 我们 
有, 如果 S > Sc , 那么 


V ；«)>-£ P ， + Z (8 )[l - pZ (0】 > p '\ Z (8)-€]. (9.18) 

因此，或者 (9.14) 成立，或者 V ,不取负值，在这种情形下 (9.15) 成立. ► 

引理4 设 


lim supZ ( x ) = r ), x —* ± oo , 


(9.19) 
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那么也有 

lim sup [ Z ( x ) + Z (— x )] = 17 , x —* ± 00 . (9.20) 

证 选择这样的 a , 使 2( a ) < A 由 (9.6), 这是可 能的. 根据上一引理，对于充分 
大的 s , 或者 

pZ ( a ) Z(a - s )^ Z ( a ) < S , (9.21) 

或者 Z ( s ) < e . 因为 e 是任意的，所以不等式 (9.21) 对于所有充分大的 s 恒成立. 
根据引理 1 ,这蕴含 ® 

Z ( s ) Z (- s ) -► 0. (9.22) 

因此，对于很大的 A 或者 Z { x ) 很小，或者 Z (- x ) 很小. 因为 Z > 0 ,所以显然 
(9.19) 蕴含 (9.20). ► 

定理的证明 假设> 0 ,因为否则就没有什么可证明了.考虑 Z 和 z 与旧中的 
均匀分布的卷积，即 

W t ( x ) = jJ ^ Z ( y ) dy , w t ( x ) = ^ J ^ z ( y ) dy . (9.23) 

我们的下一个目标是证明，当 * — 时关系式 

W t ( t ) = \ J t Z ( y ) dy ^ r , 

或 

叭 ⑼ = 1 f t Z{y)Ay ^ V (9 . 24) 

之-定成立. 

由 （9.7), Z ( a :) 和 W t ( x ) 的上界（对于固定的 t ) 是相同的，从而叭的最大 
值彡 另一方面，呢满足把 2 换成叫的更新方程 (9.5). 如前所述， 这盘含 呢 
在使斯为正的点上，即在 - h 和 t + h 之间达到最大值.对于 | < * < *， 

W t ( x ) = \ J t Z ( y)dy + \ J o l z ( V ) + Z (- y )] dy . (9.25) 

两个积分区间的长度的和是 *. 因此由 (9.20) 可知，对于充分大的 MROe ) < 
ri ( x / t ) + e . 于是，如果 W t ( x ) > fj , 那么点 z —定接近于一定接近于 

①容易看出. （9.22) 等价于 t/{J + Ot/{J-0 — 0. 如果 WO 表示由 F 支配的 M 机游动 {S„} 进 
入/的概率，邱么 (9.22) 也等价于 p{/ + t}p{I -1} - 0. 如果这不成立，那么在进入/ + 1 — 
次后到达原点旁的概率不魍于0, F 不可能是 》* 时的. 
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V- 如果 网在点 * < | 上达到最大值，那么类似的论证表明 I 一定接近于0, W t ⑼ 
一定接近于屮 

我们现在巳经证明了，对于较大的或者恥⑴接近于7；,或者叭⑼接近于 
”.但由 (9.23) 可以看出，由 (9.20), 应有 

lim 8 up [ Wt ( t ) + W t (0)] = lim sup t _1 f [Z(y) + Z{-y)]dy ^ ij . (9.26) 


因此，由这两个函数的连续性推知，或者网⑷—》7,呎⑼ — 0,或者这些关系式 
对交换了的极限成立. 

由对称性，我们可以假设爪⑷ — 即 


=* _1 乂 [z(^t + y)+z(^t-yj^dy-^i]. 


(9.27) 


由此推出，对于任意大的 t , 存在这样的值 x 使得 ZOc ) 和 Z(t - X )两者都接近 
于 r ?. 根据引理3,这遣含对于较大的⑷取0以外的有界值，从而由 （9.22) 得 
Z (- t ) -* 0. 因此，当 t — 00时， C/{J - 0 - 0,由引理2,这就完成了证明. ► 


11.10 习 题 


(也见 6.13 节中的习理12 - 习埋 20.) 

1. 去掉 F (0) = 0这一假设，相当于把 f 换成分布 F # = P H 0 + gF , 其中 if 0 集中于原 
点上 ， p + <? = 1.那么 U 由 t /* = £//<?代替.证明这在概率上是定义的明显的推论， 
并在形式上 （ a ) 通过计算卷积， （ b ) 由更新方程来验证这个断言. 

2. 如果 F 是上的均匀分布，证明 

U ⑷ = y ^(— 1 )* 0 *~* - ,n $ t ^ n + 1. 

k =0 - 

在排队论中经常遇到这个公式,但它没有揭露出 C ； 的本质.渐近公式 (K U { t )- 2 t - | 
更有趣.它是 (3.1) 的直接推论. 

3. 假设^ 0,且|/|在 JT 55 上是可积的，证明2是直接可积的. 

注在下列3个习题中，我们假设么和 A 是相应于 * 和 q 的标准更新方程 (1.3) 
的解. 

4. 如果 z —* oo 且当 : e —* 00时 zi 〜2,证明 Zi 〜 Z . 

5. 如果是名的积分，且句⑼= 0,那么為是 Z 的 积分. 证明 ：如果 * = X "- 1 ,那么 
Z 〜 x "/( n / i ), 只要 n < oo . 
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6 . (推广）如果 a = G1M 其中 G 是一个在有限区间上有限的测度)，那么也有 A = 
GirZ . 对于 G(x) = a:°(a > 0) ,证明， 

如果 z ( z ) 〜 a :。 -1 ， 那么 Z ( a :) 〜 *°/( a / i ). 

7. ( 与 11.3 节定理 2 有关的结果) •用 / r 表示广*的密度，令《 = «- / - / r •证 

明：如果 / r 是有界的，那么 «(*)- 1//!. 特别地，如果/ — 0,那么 u - 1/ M . 

8 . 如果 F 2 * 有直接可积的密度，那么 K = I /一 1 - F 的密度《趋于1/>. 

9. 利用 (4.4) 证明， Z ( t ) = V(t) - V(t - h ) 满足带有 z ( t ) = Fo (*)- F 0 ( t - ft ) 的标准更 
新方程.直接由更新方程证明： V ( t ) - V ( t -h)^ h/^. 

10. 剎余的等待时问和已度过的等待时间的取合分布. 利用记号 （4.7) 来证明，当 t — 00 

P{t — Swt > x,Sn , +1 — t > y } — » J [1 — F ( s )] ds . 

(提 示： 对左边推导一个更新方程 .） 

11. 穗态性质. 考虑具有 (4.6) 给出的初始分布 F 0 的延迟了的更新过程.在 t 和 t + { 之间 
出现更新时刻 S „ 的概率满足更新方程 

»(«.0 = Fo(t + 0- Fo ( t ) + Fo-kH(t,a 
不利用计算而证明 I H[t,0 = F 0 (t). 

12 . 最大的观察寿命. 在标准常返更新过程中，令 V ( i ,0 是直到时刻 t 观察到的到达时刻 
的最大间隔的长度 >《的概率.证明， t 

V ( i ,0 = l - F (0+ / V(t-y,i)F{dy}. 

讨论这个解的特性. 

13. 对于 11.5 节中定义的更新时$的个数叫，证明， 

E(N?) = Y ) (2k+ l ) F fc *(0 = - U(t). 

k =0 

由上式和更新方程利用分部积分法证明 I 

E ( A ?) = U : U(x)dx +^t + 0( t ), 

从而根据中心极限定理的估计有 Vax{N t ) ~ (< r 2 // i 3 )'. ( ffi . 这个方法也适用于算术分 
布，并且比第1卷 13.12 节的习® 23中所述的同一结果的推导更可取 .） 

14•如果 F 是一^正常分布， a 是一个常败，那么可以把积微分方程 Z ' = aZ-aZ-kF^, 
成 Z(t) = Z (0) + a / 0 f Z ( t - i )[ l - F (*)] dx . 

15. 广义的 II 型计數器. 要进入计数器的质点构成 一个泊 松过程 •第 j 个到达的质点使计数 
器关闭一段时间乃，并消除它前面 的质点的后故 （如果有的话) . 乃是彼此独立的，且 
与那个泊松过程独立，乃还有共同的分布 G •如果 K 是一个关闭时间间隔的长度，且 
幺⑷= P{Y > t}, 证明 I y 是一^正常变量，且 

Z ⑷= [1 - G ( t )] e - a， + [ Z(t- *).(1 - G ( x )]* e _ a ' dx . 

Jo 

证明 I 为使这个更新过程是可终止的，当且仅当 G 的期望 p < o ' 1 . 讨论 11.6 节的渐 
近估计的适用性. 



16. 交遑安全岛的 作用. [11.7 节例 （ b )] 双向的交通流在两条独立的单行车道上运动，相当 
于两个具有相等密度的泊松过程.为了实现穿过行车道所需要的平均时间是芡,把么> 
式 (7.10) 做这一改变后就可应用.但是交通安全岛有这样的作用，即总的穿过车道的 
时间是两个有由 (7.10) 给出的期望与方差的独立变量之和.讨论实际的作用. 

17. 质点到达计数器的时刻构成一个分布为 F 的常返更新过程.在每次记录后计数器关闭 
一段时间，这段时间有固定的长度 （， 且在这期间到达的所有质点都不起作用.证明> 
从关闭期的末尾到下一次质点到达的时间的分布为 


JjFd + t - y )- F ( i - »)] l /{ dy }. 


如果 F 是指数分布，那么这个分布也是指数分布. 

18. 朴线性更新.一个粒子的寿命服从一指数分布，在它的寿命终止时，它产生 fc 个以同样 

方式进行的独立复制品的概率为 P*(fc = 0,1,2, •••)• 整个过程在 t 前停止的概率 F ⑴ 
满足方程 ^ 

即) = po(l -e-°*) + Y,P k J o oe- a(, ― >F fc (a:)dx. 

(处理这样的方程没有一般的^法 .） 

19. 设 F 是 R 1 上的任一分布，其期望 p > 0,有限二阶矩为 m ,. 证明 


其中: r + 照例表示: t 的 正部.提示， 如果 Z ⑴表示左边，那么 Z 满足更新方程，其中 

i f F ( x ) dx,t < 0,«(*) = — / (1 — F ( x )) dx,t > 0. 

〆 J-oa M Jt 

20. R 2 中的史新定班.设对偶 （ X , y ) 的分布集中于第一象限内•设 J 是区间 0<: r , V ^ l . 
对于任一向量用 J + a 表示把 J 平移后所得的区间 .11.9 节引理1可推广如下. 
对于任何固定向量 a 和6,当 f -* oo 时， 

U{I + a + tb }~ U{I + tfe } -* 0. 


( a ) 如果认为这当然成立， 证明： 边缘分布的更新定理癟含 U{I + tb }-^ 0 . 

( b ) 证明^引理的证明珂以照搬过来 .® 


①最近 • P. J. Bickel 和 J. A. YahB.v[Renewal theory in the plane, Ann. Math. Statist., vol. 
36(1965) pp. 94&-95S] 给出了平面上的更新定理的一个更恰当的阐述.他们考虑在半 ft 为 r 和 
r + a 的两之间的区域中 3B 的平均次数并令 r-oo. 
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本章讨论随机游动的问题，强调组合方法和阶梯变量的系统应用.某些结果将 
在第18章中用傅里叶方法重新推导并加以 扩充. （随机游动的其他方面已包括在 
6 .10 节中了）我们的注意力基本上局限于两个中心课题•第1个课题是证明在第1 
卷第3章中对掷硬币的起伏推导出的奇妙的结果，对更一般的情况也成立，而且实 
质上可用同样的方法来推导•第2个课题号首次通过和破产问题有关.现在流行的 
是把这些课题和著名的维纳霍普夫 ( Wiener - Hopf ) 理论联系起来进行讨论，但是 
这种联系并不十分密切.我们将在 12.3 节和 18.4 节中讨论它们的联系. 

斯帕里 • 安德森 （ E . Sparre Andereen )1949 年关于组合方法在起伏理论中的威 
力的发现，为整个随机游动理论提供了新的 方法. 从那时起，发展是极其迅速的， 
随机游动和排队问题之间的密切联系*的意外发现也促进了随机游动理论的发展. 

这方面的文献浩如烟海，令人眼花 缭乱. 本章所介绍的理论相当初等和简单， 
初学者无法想象在理解这些问题的自然背录之前它们会 有多么 困难.例如， 12.5 节 
的初等渐近估计包括许多以前用高深的方法花费了很大气力才得到的实际结果. 

12 .6 节〜 12.8 节几乎和第一部分无关.毫无疑问，我们的论述是片面的，忽视 
了随机游动的一些有趣的方面，比如它与位势论及群论的联系 .® 

12.1 基本的概念与记号 

在本章中 x 2 , …是独立随机变量，具有不集中干半轴上的共同分布 
[对于满足 F (0) = 0或 F (0) = 1的分布，这个课题已被更新理论所包含.1 导出随 
机游动是 随机变量序列 


S o = 0, S n = X 1 + •■■ + X n . (1.1) 

有时我们考虑给定序列 { Xj } 的截段 ( X i+1 ，■- •， Xfc ), 它的部分和0, S j+ 1 - Si ，…， 
Sk - Sj 称为这 个随机游动的 截段. 按通常的方式把下标作为时间参数处理.于是， 

①笫一个这样的联系似乎是 D. V. 林徳莱在1952年相出的.他推导出了一个积分方程，此方程现在 
宥来是 Wiener-Hopf 型的. 

® 关于其他方面见斯皮策尔的书 （1964), 虽然这本书局 限于讨 论算术分布.关于可适用于高维情形的 
组合方法，见 C. Hobby and R. Pyke, Combinatorial requite in muUidimensioruU fluctuation 
theory , Ann. Math. Statist., vol. 34(1963)pp. 402-404. 
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时刻 n 把整个随机游动分成一个前截段和一个剩余截段.由于= 0,所以随机游 
动从原点开始.所有的各项都加上一个常数 a , 我们就得到一个从 a 开始的随机游 
动.因此， S „, S „ +1 ，…是由 F 导出的从&开始的随机游动. 

概论考虑随机游动的图形，我们将会注意到&达到纪录值的诸点，即大 
于所有以前达到的值 Sor - ^ Sn ., 的点.按照 6.8 节引入的术语，这些点是阶梯点. 
(见 6.8 节的图 6*1.) 阶梯点的理论上的重要性可由下列事实看出：它们之间的截 
段是彼此的概率复制品，因此通过研究第一个阶梯点可以得出一些关于随机游动 
的重要结论. 

在第1卷中，我们曾反复地研究了这样的随机游动，使得分别以概 率？) 和 
取值+1和 -1. 在这样的随机游动中，每个记录值比前一个记录值大1,依次的 
阶梯点只不过是首次通过 1 , 2 ,. ••的 点. 用现在的术语，我们可以说，阶梯高度是 
预先知道的，只需要研究相邻的阶梯点之间的等待时间.这些等待时间是独立随机 
变贵，其分布和首次通过+1的等待时间的分布相同.第1卷 11.3 节 (3.6) 求出了 
这个分布的母函数，它由下式给出 I 


[1 - y / l - Apqs 2 ]/(2 qa ), (1.2) 


其中 f 表示正根1亦见第1卷 14.4 节； 关于显式见第1卷 11.3 节 （ d ) 和第1卷 
14.5 节].当 p < g 时，首次通过时间是亏损随机变量，因为取正值的概率等于 p / 9 . 

在达到新纪录值前，同一纪录值可以重复几次.这种达到相对最大值的点称为 
弱阶 梯点. [在简单的二项随机游动中，第一个弱阶梯点或者是 (1,1), 或者是形如 
(2 r ,0) 的点 . 1 

在这些开场白之后，我们正式引入阶梯变 M , 这部分地璽复了 6.8 节中的内容. 
定义依赖于一个不等式，从而存在4种相应于四个可能性<,&>,>的阶梯变 M . 
这就导致用显然的术语，即上升 阶榉变量和下降阶梯变量，严格阶梯变量和弱阶梯 
变量， 来描述双重的分类.上升变童和下降变 董与加 和减.或者最大值与最小值之 
间的熟知的对称性有关.但是严格变量和弱变量之间的差别给叙述和记号带来了困 
难.最简单的办法显然是只考虑连续的分布因为这时严格变贵与弱变童以概率 
1 相同.建议初学者这样做，对严格变量和弱变世不加区分，但是对于一般的理论 
以及像掷硬币游戏这样的例子，这种区别是不可避免的. 

为了引入必要的记号和约定，我们考虑严格上升阶梯变量.我们将证明，弱阶 
梯变量的理论可作为严格阶梯变鼉理论的简单推论而得到.下降阶梯变量不需要 
新的理论.因此，我们将取严格上升变董作为典型变撤.在没有发生混淆的危险时， 
我们将省去限制词“上升”和“严格 ". 

严格上升阶 梯变量 对 n = 1,2, • • •(不包括原点） 考 虑点列 （ n , 汉 0 .第一个严格上 
升 阶梯点 (负，尤 5) 是这个序列中第一个使 > 0 的项. 换句话说 ，名 是首次进入 
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(严格）正半轴的时刻，定义为 

{^i = n } = {Si <()，-••， 5 „_i < 0,5 n > 0}, (1.3) 

且戈！ = S ^ i . 变董负 称为第一个阶梯时刻，戈！称为第一个阶梯 高度. 如果事件 
(1.3) 不发生，那么这两个变量就无法定义，从而它们都可能是亏损变量.① 

关于（负，龙）的联合分布，我们记 

P{^i = n , J ^ < i } = H n { x ). (1.4) 

边缘分布为 

P{^i = n } = W n ( c »), n = l ，2, …， (1.5) 

P{^i = H n { x ) = H { x ). (1.0) 

n=l 

这两个变贵有相同的亏量，即 1 - H ( oo ) > 0. 

紧接在第一个阶梯时刻后的随机游动的截段是整个随机游动的概率复制品.它 
的第一个阶梯点是整个随机游动的第二个阶梯点，它具有下列性质^ 

S n > So ,-■■ , S n > S n - i , (1.7) 

它称为整个随机游动的第二个阶 梯点. 它具有 (^ + ^2,^,+^) 的形式，其中对 
偶（夕 i , M ) 和 (^2,^2) 是独立同分布的.（亦见 6.8 节）照此继续下去我们可以定 
义这个随机游动的第3,_4,…个阶 梯点. 因此， 点 ( n , S „) 是一个上升阶梯点， 如果 
它满足 （1.7) •第 r 个阶梯点（如果它存在)具有（％ + • • • ++…+米）的形 
式，其中对俩 (凡屬 是相互独立的，具有共同分布 （1.4).( 见 6.8 节中的图 6*1.) 

为了节省记号，我们对于和负+…+天与况+ ... +米不引入新的宇母. 
它们形成“到达时刻的间 tt ” 为爲和冰的（可能是可终止的)更析过 《. 当然，在 
随机游动中只有衷才具有时间变量的性质.阶梯点本身形成一个二维更新过程. 
我们用 

^ = ( 1 . 8 ) 

表示阶 f 高度过程 的更新 測度.(此处 H °*= rlH ,.) 它的非正常分布函数为 rP { x ) = 
ip {- co , x ). 当 ; c < 0 时等于 0; 当 x > 0 时， VKz ) 等于1加上带形57^中阶梯点 


①习埋3~习埋6提供了不了修一)»理论就珂以理解的说明性练习. 
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的期望个数(时间不 限). 我们从 6.6 节和 11.1 节中知道，对于所有的 xMx )< oo , 
并且在亏损的阶梯变貴的情形下， 

^( oo ) = g ^( oo ) = T - i R . (1-9) 

最后，我们对在原点上具有单位质量的原子型分布引入记 号咖. 因此，对任一 
区间/, 

tT 1 ' ㈣ 

弱 上升阶 梯变置为使点(«,5„)是弱(上升)阶梯点，当且仅当对于 fc = 0,1,…, n , 
S „ > S k . 严格阶梯变 董和弱 阶梯变童的理论大体上是平行的，我们将故意地使用 
相同的宇母，用横线表示弱 变量： 于是歹！是使得负<0,…， SnqCO , 但5„>0 
的最小指标 n . 如前所述，当分布 F 连续的时候，严格变量和弱变量之间的乏味的 
区别就是不必要的了.即使在 一般情 形下，也容易用分布丑来表示弱阶梯高度的 
分布頁，这样我们可以把注意力集中于 （1.6) 所定义的唯一分布上. 

第一个弱阶梯点和第一个严格阶梯点等同，除了随机游动在返回原点前只取 
负值的情 形外. 在这种情形下，= 0,我们令 C = P {^ i =0>. 因此 

C = P {5 i < 0, …， Sn-i < 0,5„ = 0}. (1.11) 

n—l 

(如果> 0,那么这个#件就不可能发生，从而0 < < < 1.) 第一个严格阶梯点 
以概率1 -（与第一个弱阶梯点重合，因此 

亙 =(如 + (1 - C)H. (1.12) 

用文字说明就 是：第 1个弱阶梯高度的分布是分布 H 和集中于原点上的原子型分 
布的混合分布. 

例 在简单的二项随机游动中，为使第1个弱阶梯高度等于1,当且仅当它的第1 
步到达 +1. 如果第1步到达 -1, 那么返回0的（条件）概率当 p > q 时等于1,当 
p<q 时等于 p /9. 在第1种情形下 （ = g , 在第2种情形下 C = p . 可能的阶梯髙度 
是 1 和 0, 当 P < g 时，它们的概率是 P 和 g; 当 P < g 时，两者的概率都等干 P. 在 
后一情形下，阶梯髙度是亏损变置. ► 

在首次进入0^3前随机游动恰有 A ： 次返回原点的概率等于 疒(1 - C ). 这种返 
回的平均次数是 1/(1-0, 这也是在下一个严格阶梯点出现之前每个弱阶梯高度 
出现的平均次数.因此 


(1.13) 
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(见习题 7) 这些关系式的简单性使我们可以避免明显地利用分布 
下降阶梯变量严格下降阶梯变量和弱下降阶梯变量可以利用对称性，即把 >变 
成 < 来定义.在需要特殊记号的个别情况下，我们用上标负号来表示下降情形.于 
是第1个严格下降阶梯点是 等等一 

立即可以看出，概率 P{jg [- = 0} 和 P{JP l= 0} 是恒等的，因为 

P{Si > 0,…， 5„_i > 0,5„ = 0} 

= P{Si < 0, • • • , S„_i < 0, S„ = 0}. (1.14) 


由此推出下降阶梯变量的类似于 （1.12) 和 (1.13) 的公式依赖于同一个惫 C. 


12.2 对偶性，随机游动的类型 

在第1卷第3章中利用简单的组合论证推导出了掷硬币的起伏的惊人的性质， 
这种论证依赖于把变 M (Xu - -,x n ) 排成相反次序.同样的方法可导致更一般的重 
要结果. 

对于固定的 n, 我们引入 n 个新的变 = 它们的部分和 

为呙= S„ - S„_*， 其中 fc = 0,1,…, n .( S 0 , …, S„) 与 （S 0 •，…, 5;) 的联合分布是 
相同的，对应关系 X* — X 把任一用（为,定义的事件 A 映成具有相同概 
率的事件#这种映射是很容易想象出来的，因为 (0, S u ---, S n ) 的图形可以通过 
把 (0.S,*,■••,«；) 的图形旋转180°得到，反之亦然. 

例⑷如果 Si <0,<0但 S„ = 0, 那么 

sr>o, .，s;_i>o, 且 s： = o. 

这就证明了上节所用的关系式 (1.14) 的正确性. ► 

我们现在把逆转程序应用于定义（严格上升）阶梯点的亊件 S n > S 0 ,--, S n > 
Sn - i - 对偶关系式是匁> = l,2,- - n. 但是， S ；； > S；_ fc 与汍 > 0是相同 

的事件，从而对于任一有限区间 J C 5^,我们有 

P{Sn > W = 0,… ，Tl _ l.aSne/} 

= P{Sj > 0, _?• = 1，…, nKSn € I}. (2.1) 

左边是“存在横坐标为 n 纵坐标在 J 中的阶梯点”的概率.右边是“在时刻 n 时进 
入 J 而在时刻 n 之前没有到达闭半直线^0,0 ” 这个事件的概率. 

其次，我们考虑把 (2.1) 对所有的 n 求和得到的结果.根据更新 测度分的 定义 
(1.8), 我们在左边得到的是 nn , 在右边我们得到的是 •■首 次进入 ^0" 之前 
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在区间 J 中逗留的期望次数”.它是有限的，因为 rp{I) < 00 . 因此，我们证明了基 
本的 

对偶性引理更新 測度分 有两种 解释对 每个有限区间 / C 0^5,值等于 

( a ) J 中阶梯点的期望 个數； 

( b ) 首次进入— 00, (i 之前在 J 中适留的期望次數 • 

这个简单的引理使我们可以用初等方法来证明一些定理.如果不利用这个引 
理，要证明这些定理就箝要用高深的分析方法.从它的分析描述中很难看出这个引 
理有什么特别的地方，但是它有一些最意想不到的、与直觉不符的直接推论. 

例 （ b ) 簡单的随机游动.在 12.1 节的例子中的随机游动中，存在一个纵坐标为 
k 的阶梯点的充要条件，是事件 {A = fc } 对某个 n 发生.我们看到，根据 p > 9或 
P < g , 这个事件的概率等于1或 ( p / g ) k - 根据对偶性引理，这就是说，在对称随机 
游动中，对所有的 fc > l , 首次返回原点之前在 fc 上适留的期望次数都等于 1. 这个 
结果的奇异特性用掷硬币的术语来说似乎更 淸楚. 结果是，平均说来，不管 fc 多么 
大，在首次到达0之前，彼得 ( Peter ) 的累枳赢利只炷过每个值 fc —次.这个结论通 
常会引起怀疑，但是可以用直接计算来验证它（习题 2). (为首次返回0所需要的等 
待时间的期望为无穷，这一已知结果可以通过对 fc 求和得到 •） ► 

在对称的二项随机游动（掷硬币）中，达到+1的概率是 1( 达到 -1 的概率也 
是 1), 但是每个这样的事件的平均等待时间是无穷的.下一定理说明这并不是掷硬 
币游戏所特有的，因为类似的结论对所有的取正值和负值的概率都为1的随机游 
动都正确. 

定理1 只存在2种类5!的随机游动. 

⑴振动型.上升史新过租和下降更 新过租 都是常返的，以概年1在 - oo 和 oo 之 
间振动，并且 

E (^ i ) = 00 , E (^ i ~) = 00 . (2.2) 

( ii ) 超向- 00 ( 比如 说). 上升更析过程可终止更新过程，下降更新过《是正常更 
析 过租. 以概丰1超向 -oo 并达到一个有限的最大值 M >0. 关系式 (2.5) 和 (2.7) 都 
成立. 

[( U ) 型的随机游动显然是瞬时的，但是 （0 型随机游动既包括常返随机游动， 
也包括瞬时随机游动.见 6.10 节的末尾 .j 

证当把严格不等式换成弱不等式时，恒等式 (2.1) 也成立.对于 J = O^S , 它化 
成 

P {5 n > Sfc.fe = 0,1, •••,«} = P{Sfc > 0, A : = 0,1, •••,«} 

=1- P {^ i _ 彡 n }. (2.3) 
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左边是 ( n ,5„) 为弱上升阶梯点的概率.这些概率相加等于多 ( oo ) < oo , 因此由 
(1.13) 我们有 ^ 

伞 — P{^i < «}]. (2-4) 

^ n=0 

当下降阶梯过程是亏损过程时，这个级数的各项取0以外的有界值，这个级数 
是发散的.在这种情形下， V >( oo )= oo , 此式表明上升过程是常返的_于是我们得到 
下述这个直观上明显的事实的一个分析 证明： 上升阶梯过程和下降阶梯过程不可 
能都是终止的. 

如果夕厂是正常的，那么 （2.4) 化成 


e(，d = 


( l - C )( l - H ( oo ))- 


(2-5) 


当 if ( oo ) = 1时，此式为 oo . 由此推出，为使 E (5 T ) < 00,当且仅当 ff ( oo ) < 1,即 
当且仅当上升变世负是亏损变贵.因此，或者这些变 M 之一是亏损的，或者 (2.2) 
成立. 

如果 E (^ r ) < oo , 那么上升阶梯过程是可终止的.以概率1存在一个最后的 
阶梯点，因此 

M = max {5 o , Si , - - •} (2.6) 

是有限的.假定第 n 个阶梯点发生，那么它是最后一个阶梯点的概率等于 1- H ( oo ), 
因此 | 见 11.6 节 (6.3)1, 


P{Af < i} = [1 - H(oo)] ^2 H n *(x) = [1- if(oo)]V>(x). (2.7) ► 

在下一定理中我们约定，如果定义积分只在 + oo 处发散，等价地说，如果 
P{X < t } 在 ^0 上是可积的，则就记 E ( X ) = +00. 

定理2 ⑴如果 Ep^sO, 那么冰 和负是正常变量®,并且 E (负 ）= oo. 

( ii ) 如果 E(Xi) 是一有 f 艮正值，那么和名是正常变量，它们的期望有限而且 

E(Jti) = E(^i)E(A!). (2.8) 


这个随机游动超向 +0 O . 

( iii ) 如果 E ( Xi ) = + oo , 那么 E ( J « i ) = oo , 并且•这个随机游动超向 + oo . 

( iv ) 否則，或者随机游动超向 - oo ( 在这种情形下，负和戈!是亏损的)，或者 
= oo . 


① 6.10 节的定理4包含下列更强的结果 t 当 E(Xi) = 0时，«机游动是常返的. 
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等式 (2.8) 是由 A . 瓦尔德在更一般的背景下发现的，我们将在 18.2 节中讨论 
这个更一般的背景.下述证明是以 7.8 节中的强大数定律为基 础的. 纯分析的证明 
将在适当的时候给出.（见 12.7 节的定理3和习题9 〜 习题11及 18.4 节 .） 

证如果 n 是第 fc 个阶梯时刻，那么我们有恒等式 


Sn (光+…十苑 ) A 
n (为 + ••• + 爲) /fc 


(2.9) 


我们现在注意到，当 ECYOs + oo 时，强大数定律也成立，这可以通过明显的截尾 
方法看出. 

⑴设 E ( Xi ) = 0.当* - oo 时， (2.9) 的左边趋于 0. 由此推出分母趋于无穷. 
这癟含负是正常变臌，且 E (5 i ) = oo . 

(ii) 如果0 < E ( Xi ) < oo, 那么强大数定律蕴含随机游动趋向 oo .由 （2.5), 这 
就是说只是正常变贵，并且 E(^i) < oo. 因此， (2.9) 中的分子和分母都趋于有限 
极限，于是 (2.8) 可由大数定律之逆 （7.8 节中的定理 4) 推出 • 

(iii) 如果 E ( Xi ) = +oo, 那么用同样的论证可以证明 E (冰 ） = oo. 

(iv) 在其余的情形中，我们来证明，如果戈！是正常变量且 E(JTx) < oo, 那么 
随机游动趋向 - oo. 考虑随机游动的第 1 步，显然有，对 * > 0 , 


P{Jti >x}^ P{Xj > x). (2.10) 

如果戈！是非正常变童，那么随机游动趋向 - oo . 如果它是正常变 M , 那么左边在 
0753上的积分等于 E (龙) • 如果 E ( J ^) < oo , 那么 E ( X !) 是有限的或 _ oo . 我们 
巳经考虑过 E ( Xx ) ^ 0的情形了，如果 E (^) < 0( 或等于 - oo ), 那么随机游动趋 
向 一 oo . ► 

由 (2.10) 和关于 i <0 的类似的不等式可推出，如果光和戈厂都是正常变 
M , 且有有限的期望，那么 P{\Xy\ > X) 是可积的，从而 E ( X 0 存在 （5.6 节的引理 
2) .当 E ( Xi ) # 0时，2个阶梯变董之一是亏损的，因此我们有 
系如果 M 和戈厂都是正常变量且有有限期望，那么 E ( X 1 ) = 0. 

其逆是不 真的. 但是，如果 E ( X ,) = 0且 E ( X ?) < oo , 那么冰和都有 
有限期望.（见习题10_更精确的结果将包含在 18.5 节的定理1 中，其中和印 
是具有分布 •^和 xr 的首次进入变量 •） 


12.3 阶梯高度的分布，维 纳-霍 普夫因子分解 


阶梯髙度的分布 H 和 F 的计算乍看来是一个很难解决的问题，并且人们最初 
就是这样认为的.但是对偶性引理可导致一个简单的解法.其思想是，应把首次进 
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入 - oo ,0 和在首次进入之前的随机游动的截段合起来考虑.因此，我们来研究修改 
了的随机游动 {Sn}, 这个随机游动在首次进入 - 00 , 0 的时刻终止.我们用 V > n 表示 
这个受限制的随机游动在时刻《时的位置的亏损概率分布，即对于任一区间了和 
n = l ，2," •，我们令 

= P {5 i >0,- -,S n >0,S n eI}. (3.1) 

(注意，这蕴含 A {^0} = 0.}与以前一样，咖是集中于原点上的概率分布. (2.1) 
中巳证明么 { J } 等于 “( n , S „) 是使得 e J 的阶梯点”的概率.因此，对 n 求和， 
我们得到 ^ 

州} = (3-2) 

其中是在 (1.8) 中引入的更新函数.换句话说，对于开正半轴中的区间 j , m 
是纵坐标在 J 中的（严格上升）阶梯点的平均个数.对于负半轴中的厂我们定 
义 V >{/} = 0. 由此推出， (3.2) 中的级数对于每个有限区间/都收敛（可是对于 
/ = "57 未必收敛).正是这个出人意料的结果使下述理论变得非常简单. 

研究首次进入就是研究弱下降阶梯过程，沿用 12.1 节的记号，首次进入 
的点是它的 j •布是但是为了便于印刷，我们把换成 P ，并用 p n {/} 
表示首 次进入 - oo,(j 发生在时刻 n 且进入点在区间/内的概率.对 n = 

Pn{I} = P{Si > 0,…， S n -i >0,5„^0,5„€/}. (3.3) 

(这蕴含 {0, cx >} =0. po 这一项没有定义 .） 这一次级数 

= 53 (3-4) 

n=l 

显然收敛且表示首次进入点的可能是亏损的分布.（换句话说， p{I} = H~{I ).) 

很容易推导出 和如 的递推关系式.实际上， 给定& 的位董 y , S„ + i € I 
的（条件）概率等于 F{J - 1/},其中 J - y 是把/平移 - j / 后得到的区间.因此， 

Pn+i{I} = J。^n{^y}F{I -y}, 如果 / c - oo ,0, (3.5 a ) 

^ n + i {/} = ^ n { dy } F {/- y }, 如果 J C 0 oo '. (3.5 b ) 

(仅当 n = 0 时原点才起作用 .） 对于有界区间 J , 对偶性引理保证了 EV > n {/} 的收 
敛性，并且 Epn{l] 恒收敛于一个不超过1的数.于是我们得到了 (>和岭 的级数 
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表达式.显然，这些和式满足 

p { I } = Jo ^{ dy } F{I - y }, 如果 / C - oo ,0, (3.6 a ) 

t / f { I } = J i {){ dy } F{I - y }, 如果 / C O.oo ', (3.6 b ) 

但必须说明， (3.6 b ) 只对有限区间 J 成立. 我们将看出， （3.6) 比 p 和0的理论上的 
级数表达式更有用.有时把区间函数 P 和少 换成等价的点函数 

p (*) = p {- oo , i }, ^( x ) = V >{- oo , x } 

较方便. 显然 (3.6 a ) 等价于 

p ( x ) = ip { dy } F(x - y ), i < 0. 

由 (3.6 b ) 我们得到，对 i > 0， 

矽 ⑻ = l + ip {0, x ) = 1 + rl >{ dy }[ F(x - y )- ■ F (- y )]. 

因此，考虑到 (3.7 a ), 我们可知 (3.6 a ) 等价于 

矽 ⑻=1 - p (0) + J 。 rl >{ dy } F{x - y ), x ^ 0. 

为了简化记号，我们引入卷积 

伞 ★F = f ^ n * F . 

因为矽集中于上，所以值 rl >- kF { I ) 等于 (3.6) 中两个积分之和，从而是有 
限的 •当岭 在原点上有单位原子时，我们可以把 (3.6) 中的两个关系式合成一个卷 
积方程 

p + rl > = rl>o + rl > irF . (3.9) 

由于 P 和少-咖分别集中于 - OO .0 和 O . cx ,' 上，所以关系式 (3.9) 完全等价于 
(3.6) 中的两个关系式. 

我们将把 (3.9) 作为一个确定未知测度 p 和少的积分方程•从 (3.9) 可以推导 
出很多在理论上很重要的结论.我们在例子的标题下列出这样的结论中最值得注 
意的定理，以表示以后用不到这些定理，以及我们进行的讨论离开了主题. 


(3.7 a ) 


(3.7 b ) 


(3_8) 
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例 （ a ) 维纳-霍普夫型因子分解.由矽的定义 (1.7) 可推出它满足更新方程 

^ = ■00 + ip-kH. (3.10) 

利用这个关系式，我们来证明， （3.9) 可以改写成等价形式 

F = H + p-Hirp. (3.11) 

事实上，取 （3.9) 和//的卷积，我们得到 

Hirp + il> — ipo = H — F + ipirF. 

从 (3.9) 中减去上式得 (3.11). 反之，取 (3.11) 和伞 的卷积，得到 
tp-AF = i/)-ipo + tpirp - (矽 一 ^o)irp = ^-ipo + p, 

这和 (3.9) 相同. 

恒等式 (3.11) 用2个分别集中于 0, oo ' 和^0上的（可能是亏损的)分布 H 
和 p 来表示一个任意的概率分布因而它是值得注意的•第1个区间是开的，第 
2个区间是闭的，但是可以用首次进入的概率表示首次进入的 
概率以消除这种不对称性.这些概率之间的关系式可以用类似于 a : < 0时 (1.12) 
的关系式给出，即 

p = ^o + (l-C)H~, 

其中 C 由 （1.11) 确定 [(1.11) 对 s > 0也成立，见 12.2 节例 （ a )】. 代入 (3.11), 经过 
明显的重排后，我们得到 

V>o - F = (1 - C )[ V > o - 丑 1★【咖- H~]. (3.12) 


当然，对于连续分布关系式 （3.11) 和 (3.12) 是一样的. 

已经用不同的办法独立地发现了这个公式的各种不同形式，而且它们引起了 
很大的轰动.关于一个不同的形式见习题19,关于它的傅里叶分析的等价形式见 
18.3 节.与维纳-霍普夫技巧的联系将在 1 Z 3 节中 讨论. 瓦尔德恒等式是 （3.11) 的 
简单推论.（见习题11及 18.2 节） 

例 （ b ) 通常很难求出//和的明显表达式.在 6.8 节例 （ b ) 中找到了一个有 
趣的分布，对它的计算特别 简单. 如果 F 是两个分别集中于 "57 和^0上的 
指数分布的卷积，那么它的密度具有形式 
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我们假设& < a , 从而 EpQ 彡0•于是和丑-的密度分别为 6 e _ te 和 be ax , 这里 
H - kH ~ = { b / a ) F , (3.11) 显然成立. ► 

(关于其他例子见习题 9.) 

我们现在来讨论作为未知测度 P 和分的积分方程的 (3.9). 我们将证明解是唯 
一的.为了简便起见，我们约定. • 如果/>是一个集中于二^3上的可能是亏损的概 
率分布， 寸-如 是这样的一个集中于 " mT 上的测度，使得对每个有界区间八测 
度 Hi + t } 是有界的，那么就称对偶 （ p , 釣在蜓芈上是可 能的. （最后一个条件可由 
更新定理推出，因为妒=1：丑"*. ) 

定理1 卷积方程 (3.9) [或者等价地， （3.6) 中的一对关系式)有且只有一个在概牟上 
可能的解 (P, 妁. 

这蕴含 P 是首次进入的点的分布， 并且伞 =£丑"*，其中孖是首次 
进入 0, oo 的点的分布. 

证设 ，和必 # 是两个满足 (3.6) 的非负测度，并且矽 # 彡咖 .利用归纳法，我 
们由 (3.6b) 得出，对于每个 n,V> # >V>o + --- + ^n, 从而在对于其他在原点上有单 
位原子的解 HJ) 对所有的区间 J 成立的意义下，我们的解 是最小 
的. 换句话说， = 是一个测度.现在由 (3.6a) 可以看出，对 r = p# - p 也 

有同样的结论 成立. 由于 （ P,V0 和 （ 〆,〆 ） 两者都满足 （ 3.9), 所以我们有 

<5 + 7 = (3.13) 

设/是一个面定的有限区间，令 z(t) = S{I + t}. 有两种可能的情形_如果 p 
是正常分布，那么 〆 6 > p 这个事实蕴含 p # = #>,从而7 = 0. 于是2是卷积方程 
z = Firz 的有界解.因此，根据归纳法，对于所有的 n , 有 

2 (*) = / Z (* — (3.14) 

于是 * 多0,且对于每个使得 J + t 包含在负半轴内的 f 有 z ⑴= 0. 对于这样的 t , 
由 (3.14) 显然有，对于是某个 F "* 的增点的每个 I /，2 (t - y ) = 0. 根据 5.4 a 节的 
引理2,这样的 y 组成的集合是处处稠密的，因此 Z 恒等于 0. 

对于亏损的 P , 我们只知道 7 > 0,于是 (3.13) 只蘊含 z 彡 F - kz . 在这种情形 
下， (3.14) 把等号换成 < 也 成立. 但是，此时随机游动趋向 oo , 从而 F "* 的质量 
趋于集中在 oo 近旁.而且对于所有充分大的 y , z{t - y ) = 0,从而 2 —定恒等于 0. 
因此，於# =也如所断言. ► 


维纳-霍普夫积分方程 


为了说明积分方程 (3.9) 和标准维纳- ffi 普夫方程之间的联系，最好从一个这 
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样的概率问题出发，使得在这个问題中出现标准维纳-翟普夫方程. 

例 （ c ) 最 大值的分布， 为了简单起见，我们假设分布 F 有密度/而且它的期望 
为负值.随机游动 { S n } 趋向 -00, 有限值随机变量 

M = max [0,5 i ， ft , •. (3.15) 

以概率1为确定的.我们打算计算它的概率分布 M ( i ) = P{Af < *}. 根据定义，此 
分布集中于 *"5^" 上.为使事件 {M <对发生，当且仅当 

•Xi = 2 /彡 a : 且 max [0, X 3 , X 3 + X 3 , • ■ ■] < i - y . 

对所有可能的 y 求和，我们得到 

M(x) = J A /( x - y)f(y)dy, x>0, (3.16) 

这与 

r°° 

M(x) = I M(a)f{x — «) d «, a : > 0 (3.17) 

Jo 

相同. 另一方面，我们由 (2.7) 知道， M(x) = [1- H ( oo )] V -( x ). 我们已 看到分 满足 
积分方程 (3.7 b ), 其中在目前的条件下， p (0) = 1. 于是通过简单的分部积分可以说 
明 （3.7 b ) 和 （3.17) 实际上是相 同的. ► 

(3.17) 是维纳《普夫积分方程的标准形式，我们的例子说明它在概率论中出 
现的 方式. 但是，维纳 -« 普夫方法的一般文献是令人误解的，因为限制于正函数 
和测度而改变（和简化）了这个问题的性质. 

N . 维纳和 E . 霍普夫用来处理 (3.17) 的巧妙方法 ® 受到了广泛的注意，巳被应 
用于各种概率问题，例如，克拉美 H . Gram 6 r 用它推导出了破产概率的渐近估计. 
这个方法要用到很难的分析丁-具，从而由现在的方法不费力地得出这些估计几乎 
是令人不安的.其更深刻的理由可以这样理解.方程 (3.17) 最多代表 (3.7) 中的两 
个方程之一，当 P ⑼< 1时就不用 说了. 单独讨论 (3.17) 比讨论 (3.7) 中的两个关 
系式要困难 得多. 例如，唯一性定理对 （3.17) 就不成立，即使只讨论概率分布也是 
如此.事实上，维纳霍普夫方法的基本思想是引进一个辅助函数，此函数在一般 
理论中没有特殊的意义.这实际上把单个的方程 (3.17) 换成一对与 (3.7) 等价的方 
程，但唯一性失去了.我们按相反的方向进行讨论，从与下列两个不可分离的问题 
有关的循环系统 (3.5) 开始：首次进入 - oo ,0 和在这个首次进入之前随机游动局限 
于 a ： > 0. 这样我们就从已知的解导出了积分方程 （3.9), 并且容易证明概牟解的唯 

①可追猢到 1931 年.在第一部专著 I E. Hopf , Mathematical problems of radiatjve equilibrium, 
Cambridge tracts, No. 31, 1934 之后出现了 大置的 文献. 
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一性.收敛性的证明、解的性质、以及最大值的分布 M 与更新测度 V * 之间的联系 
都依赖于对偶性引理. 

第1个发现可以用对偶性原理来解维纳-霍普夫方程 (3.17) 的是 F ， 斯皮策 
尔把维纳- 翟普 夫理论和概率问题联系起来的普通方法，是从与下面的 (9.3) 
有关的公式的傅里叶形式开始的，我们将在第18章中讨论它们的傅里叶形式.现 
在有很多的文献把维纳-霍普夫方法与概率问题联系起来，扩大了组合方法的范 
围.这类文献大多数利用傅里叶方法 .® 

12.4 例 


首次进入分布的显式一般说来很难得到.幸好有一个值得注意的例外，我们将 
在例 （ a ) 中讨论它.乍看起来这个例子中的分布 F 似乎不太自然，但是这种类型的 
分布经常出现在泊松过程、排队论、破产问题等等之中.如果考虑到我们的一般结 
果的极其简单性，那么我们就很难相信人们在各个特殊的情形上花费了（经常是重 
复的）多少精力，运用了多少分析技巧. 

例 （ c ) (以相当平凡的形式）给出了具有有理母函数的算术分布 F 的情形下的 
全部计算.之所以给出计算，是因为同一方法可用于有理拉普拉斯变换或者有理傅 
里叶变换.在习题3 〜 习题6中可找到另外一个例子.例 （ b ) 讨论具有独立意义的 
一般关系. 

我们沿用上节的 记号. 于是 i / 和 p 分别是首次进入和的点的 
分布.（换句话说，"和 P 分别是第一个严格上升阶梯高度和第一个弱下降阶梯高 
度的分布 •） 最后，0 =乙丑"*是对应于丑的更新函数.我们的主要工具是方程 
(3.7 a ), 它说明对于 i <0, 首次进入 - oo ,0 的分布为 

P » = Jo 岭 - w ). (4-1) 

例 （ a ) 具有一个指教型尾部的分布出人意料地经常 出现. 例如，在 6.8 节例 （ b ) 的 
随机游动和相应的排趴过程 6.9 节例 （ e ) 中，两个尾部都是指数型的.作为介绍，我 
们假设尸的左尾部是指数型的，即对于 a : < 0, F ( x ) = q ^. 不管切是怎样的， (4.1) 
表明，对于 * < 0, p ( x ) = oeP ' 其中 c 是常数.由于得到了这个结果，我们交换2 

① The Wiener-Htrpf equation whole kernel is a prbability density, Duke Math. J., vol. 24(1957) 
pp. 327-343. 

② 由于参考文歒比较混乱，再加上许多论文所用的方法受历史发* 的偏 然性的彩响，所以对参考文献 
作一个有意义的简介是不可»的.向《率论范围以外的推广曾举例说明于 G. Baxter, An operator 
identity, Pacific J. Math., vol, 4(1958)pp.64»^63. 




个半轴的作用（这部分地是为了便于应用我们的公式，部分地是由于它在排队论中 
最重要的应用).其次假设 


F (*) = l - pe - aI , x ^ O , (4.2) 

而对 a : < 0不加任何条件.为了避免不必要的复杂化，我们假设 F 有有限的期望 M , 
并且假设 F 是连续的.由本节开始时的说明可知，阶梯高度分布 H 的密度与 e -* 
成正比.我们现在来区分两种情形. 

⑴如果 /x > 0,那么 H 是正常分布，从而对 x >0, 

H ( x ) = 1 — e -as , ^( x ) = 1 + ax . (4.3) 

[后者显然可从 ^ = 或更新方程 (3.10) 推出 . 1由 （4.1) 我们得到 

p ( x ) = F ( x ) +a J F ( a ) da , ® < 0, (4.4) 

于是我们得到了所有要求的概率的明显表达式.简单的计算表明 

p (0) = 1 - a / i - (4.5) 

这是 （2.8) 的特殊情形，因为根据 (2.5) 有 （1 - p ( O ))- 1 = E (^). 

⑻如果 m < 0,那么关系式 (4.3) 和 (4.4) 仍表示积分方程 (3.9) 的一个解，但 
是由于 (4.5), 在 p < 0时它在概率上是不可能的.对于正确的解，我们知道丑有 
密度 Mi ) = ( Q - k ) e ~ ax , 其中0 < fc < a , 因为是亏损分布.简单的计算说明， 
对 * > 0,#⑻ = ( a - 未知常数 A : 可由 〆 0) = 1这个条件得到.通过常规 

计算可以证明 fc —定是方程 （4.6) 的唯一 正根. 给定这个超越方程的根，我们就又 
得到了孖，/> 和沴 的明显公式. 

读者容易验证，当随机游动的变董•是整值随机变童且分布 F 有一 
个几何 型尾部 ，即 F 对整数 fc >0, 賦予重 M 9 沪时，也可得到同样的结果. 

例 （ b > 相伴随 机游动 .假设尸的期望并且存在 fc #0, 使得 

厂 #尸{办} = 1. (4.6) 


给定直线上的任意一个测度 7. 我们称由 


a 7 { dy } = e fc »7{ dy } 


(4-7) 
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定义的新测度 a 7 是7的相伴测度 . F 的相伴测度也是正常概率分布，我们称 
由《尸和产生的随机游动 是彼此相伴的 .® 容易看出，与其本身的 n 重卷积 
是与 F "* 相伴的，从而记号的意义是明确的.此外，递推公式 (3.5) 表明， 
变换 a Pn 和在新随机游动中的概率意义与 P „ 和也*在旧随机游动中的概率意 
义 相同. 由此一般地推出， 对于与相伴的随机游动，变換 V , a 4 等具有明显 
的 意义. [这也可以从积分方程 (3.9) 直接看出 •] 

积分 ,00 

m = J e^F{dy} 

对于0和 fc 之间的所有 * 都存在，在这个区间内4是无限可微的.因二阶导数是正 
的 ，故冷 是凸函数.如果 < t >'{ k ) 存在，那么多⑼=利*:)这个事实 M 含 少 '⑼和 < t >'{ k ) 
具有相反的符号.因此，由尸和° 尸 导出的随机游动趋向相反方向.（即使在 ° F 没 
有有限期望的例外情形下，这仍是正确的 .） 

于是我们得到了一个可以广泛应用的方法，它把关于满足 M < 0的随机游动 
的事实变成期望为正值的随机游动的结果，反之亦然. 

如果 # i < 0,那么阶梯髙度分布 H 是亏损的，但是疋常分布.这就是说 

f ° C e k yH { dy } = l . (4.8) 

Jo 

相伴随机游动的方法的威力多半来自于这个说明.实际上，我们从 11.6 节知道，如 
果我们巳知方程 (4.8) 的根，那么可以得到上升阶梯过程的极好的渐近估计.如果这 
些估计需要用到那么这些估计就没 有什么 用处,但是我们现在看到 (4.8) 和 (4.6) 的 
根是相同的. 

例 （ c ) 有界的舁术分布 •设 a 和6是正整数，是步长为1且在 = 上 

有跳跃 A 的算术分布.测 度矽和 P 也集 中于整数上，我们分别用分和 M 表示它们 
在 fc 上的跳跃.首次进入 ^0 发生在一个整数彡一&上，从而对于 fc < - b , p k = 0. 
我们引进母函数 


^(») = £v>k« fc , R(a) = Yi PhS k - (4.9) 

k=—b fc=0 k=—b 

它们与第 1 卷第 11 章中的母函数的不同之处，在于#和也包含 a 的负数次幂， 
但是很明显，基本的性质和法则仍然不变.特别地 ， M =妒 (1) 是 F 的期望.分布的 

① 这个概 念曾被 A. 辛饮，瓦尔德 （A. Wald) 和其他人使用过.但从未被充分使用过.变换 (4.7) E 
用于 11.6 节的更新理论和（由于使用了母函数而以伪装了的形式）第1卷 13.10 节的定理 X{ui), 
并将用于 13.1 节 (1.8) 的拉普拉斯变换中，方程 (4.6) 也在维纳- 8普夫理论中起作用. 
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卷积对应于母函数的乘积，因此基本积分方程 (3.9) 等价于！？ + JI = 1 + 或 


步 (s) 




(4.10) 


分子和分母分别是6次和 a + 6次多项式.当 M < 1时，左边的幂级数是正则 
的，因此分母:的所有位于单位圆内的根应与分子的根相抵消.我们着手证明这个要 
求唯一地确定 了只和 A 

为具体起见，设 P = 0. (关于 以0 的情形见习题12和习题 13.) 于是 a = 1 
是方程 «?(«) = 1的二重根.对于 |a| = 1,我们有|$(«)| < $(1) = 1,其中不等号只 
有在对干使 fk >0 的每个 fc 都有= 1时才成立.由于假设分布 F 的步长为1， 
所以这只有当 * = 1时才成立.从而没有 $(s) = 1的其他根位于单位圆 周上. 为了 
看出有多少根位十单位圆内部，我们考虑一个由 


P(8) = s 6 [#(s) -q], g> 1 

定义的 a + b 次多项式.对于|8| = 1 ,我们有 \ P { 8 )\> q - l > 0 S . 

\P(8) + q8 b \ = ma)\^l<q\a b \. 

根据#歌 (Rouche) 定理 ®, 这龜含多项式 P(s) 和 g# 在单位圆内有相同数目的零 
点. 由此推出 P 恰有 b 个根满足 |a| < 1,有 a 个根满足 |s| >1. 由于 00) = 
0, P(l) = 1 - 9 < 0,而对于大的 a, P(s) > 0,从而 P 有两个实根〆< 1 < * "•当 
<r — 1时， p 的诸根趋于 #(s) = 1的诸根，因此我们最后断言， （4.10) 中的分母以 
1为二重根，有 6-1 个根灼 ，… ，朴 满足 ) aj \ < 1,有 a-1 个根内，…，〜―满 
足|巧| > 1. 于是分母具有形式 

a 6 (#(s ) - 1) = C(i - 1) 2 (« «6_ i)(s -<ri) •••(«- <7 a _i). (4.11) 

根 ai, ••-,56-1 必定与分子的根相抵消，因为系数 t 是有界的，所以有一个根 
a = 1也与分子的根相 抵消. 这就确定了少(除了一个乘积常数外).但是，根据定义 
妒 (0) = 1, 从而我们得到了所要求的显式 

? ( S ) _ (1 - *)(1 - «iM ) … (1 - a / oa - i )' ( 4 . 12 ) 

把它展成部分分式可得也《的明显表达式，这个公式的一大优点是知道了主根后可 
得出合理的渐近估计（见第1卷 11.4 节) • 


①例如，见 E. Hille, Analytic function theory, vol. I, section 9.2.(Ginn and Co., 1959.) 
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关于首次进入概率 M 的母函数艮我们由 （4.10) 和 (4.12) 得到 

R(a) = 1 + (7-(-1)°-^! ••• a a ~i(l - 1/8)(! - Sl /s ) … (1 - s 6 _ i / s ). (4.13) 


[系数 C 7 由 (4.11) 定义，它只依赖于给定的分布{/*}_】部分分式展开式又可 
导致渐近 估计. （在习题12〜习题15中继续讨论 •） 

12.5 应 用 

在 6.9 节中曾指出，排队论的一个基本问题是在具有使得 p = E ( X fc ) < 0的变 
最 Xfc 的随机游动中求出 

M = max [0,5 i ,---] (5.1) 


的分布 M. 6.9 节例 （ a) 〜例 （ c) 说明同样的问题也出现在其他的领域中，例如在复 
合泊松过程的破产问题中.在这种情形中以及在排队论中，基本分布具有形式 

F = A - kB , (5.2) 

其中4集中于0^5上， S 集中于 上. 我们假设 A 和 B 有有限的期望 a 和 
-b, 从而 F 的期望为 /i = o-6. 我们还假设 F 是连续的，以避免严格阶梯变量和 
弱阶梯变童之间的乏味的区别. 

和在上两节中一样，我们分别用 H 和 P 表示上升和下降阶梯高度的分布.（为 
了一致我们应把 P 写成 //_) 换句话说， H 和 P 是首次进入0^5和(也是首 
次进入相应的闭区间）的点的分布•在 12.3 节例 （ c ) 和 (2.7) 中曾指出，如果 M < 0, 
那么 

= ^ = [1- H ( oo )] f ； (5.3) 

如果 F 的尾部之一是指数型的，即 

F ( x ) = l - pe -°*, *>0, (5.4) 

或者对于*<0, F ( x ) = qe ax , 那么 12.4 节例⑷包含了上述分布的一个明显的公 
式①_ 


①关于具有有限多个《子的算术分布的情形， 12.4 节例 （c) 得到了另外一个明 ft 的公式.这个明 a 的 
公式并不实用，但是如果巳知分母的主根，那么利用其部分分式*开式可导出 ft 好的渐近估计.当 
F 的特征函数是 有理* 数时，同样的方法也适用于傅里叶变换.这个说明包含了文離中讨论的许多 



幸好，如果 F 具有形式 (5.2), 并且 

A ( i ) = 1 - e -° z , x >0, (5.5) 

那么条件 (5.4) 成立.于是 。 

P = J e °» B { d 2/}. (5.6) 

因此，当打往电话交换台的呼叫服从泊松分布或服务时间服从指数分布时，我们的 
简单结果可用于排队论.此外，现在的条件包括了复合泊松过程中的破产问题.现 
在有大量的应用方面的文献.在关于分布 S 的各种假设下讨论特殊的问题，有时， 
比如在破产（输光）问题中，这种假设以伪装了的形式出现.实际上，只要利用 (5.4) 
而不利用条件 （5.5) 和 (5.2) 的组合就可以达到较大的一般性和简单性.我们在这里 
得到一个在一般理论中可以节省思考的重要例子.在一般理论中，我们的思路不会 
被特殊情形的偶然性搞乱. 

例 （ a ) 辛饮-波拉杰克 （ Khintchine > Pollaczek ) 公式. 假设尸具有 (5.2) 的形式， 
其中>1由 (5.5) 给出，并且 p = $ - 6 > 0. 这个随机游动趋向 oo , 我们必须把 (5.1) 
中的最大值换为最 小值. 这就是要把 (5.3) 中的 H 换为由 (4.4) 给出的分布 p , 
用简单的分部积分可以证明，对 : r < 0, 

P(x) = a j B { y ) dy . (5.7) 

从而 〆 0) = tub , 此对于 i < 0, 

P { mm (5 o , ft , • • •) ^ a :} = (1 — ab ) ^ p n *( x ). (5.8) 

这就是著名的辛钦-波拉杰克公式，此公式巳在各种特殊情形下被多次重新发现， 
所用的方法都是拉普拉斯变换[这种方法不适用于形如 (5.4) 的较一般的分布].我 
们将在 18.7 节的习题10和习题11中再次讨论它 • 

例 （ b ) 对偶 情形. 仍考虑上例中的分布，但这里要求 M < 0.正如 12.4 节例 （ a ) 第 
2部分指出的那样，在这种情形下 

P { max (5 0 , Si , • • •) ^ *} = ^(*) = 1 - (l - e ~ kx , (5.9) 

其中《是“特征方程” (4.6) 的唯一 正根. [由于当 n ^ O 时我们有 ri >{ x ) = 1+ aar , 
*>0,所以这个结果可以利用相伴随机游动的方法得到 .] 在排队论中 (5.9) 菹含， 
在一个服务时间服从指数分布的服务员那里，等待时间的分布超于一个栺數极限 
分布. 

例 （ c ) 渐近估计. 利用 12.4 节例 （ b ) 所 述的相伴随机游动的方法容易得到关于下 
列分布的尾部的有用 估计： 


M{x) = P{max(5o, 5i, 《 a:}. 


(5.10) 
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下述简单方法可以代替应用方面的文献中对特殊问題所用的许多复杂 计算. 它是 
11.6 节中一般理论中一个特殊情形，但是为了方便起见，下面的叙述是自成一体 
的. 

分布 M 由 (5.7) 给出.其中妒表示一个对应于亏损分布丑的更新测度.对于 
与 H 相伴的正常分布 a i /, 有一个由 ° V >{ dx } = e fc *^{ d ®} 给出的相应的测度 a V >, 
其中 A : 由 （4.6) 或 (4.8) 给出.因此 (5.3) 可以改写成形式 

M { dx } = [1- ff ( c »)] e - fe * (5.11) 

根据 ii . i 节的基本更新定理，更新 测度* v 是渐近均勾分布的，密度为 r 1 , 其中 

/3 J °° xe kx H { dx }. (5.12) 

因此，在 (5.11) 的两边取 t 到 oo 的积分，我们看出，当 t - oo 时， 

(5.13) 

只要 々 < oo . [否则 1 - M ( t ) ■ o ( e - kt ).] 

常数依赖于通常不是明显已知的分布丹，但是常数 fc 只依赖于给定的分布 
F . 因此，在最坏的情形下， (5.13) 是包含一个未知因子的估计，即使这个结果用其 
他方法也不容易得到.下列说明重要的应用 • 

例 （ d ) 克拉美的破产板牟 估计. 我们现在把上述结果应用于例 （ a ). 这里随机游 
动趋向 + oo , 从而应交换正半轴和负半轴的 作用. 这就是说， A ： < 0 ,分布 H 被换 
成首次进入=557的分布 (5.7). 于是 (5.12) 呈下面的形式： 

)3 = o J ° e _| fc , v | j /| B ( y ) dy . (5.14) 

我们看出， 〆 0) = afe , 因此 (5.13) 等价于下述断言： 当 ; r — 00时， 

P { min (5 0 , Sl -.- Xx }- (5.15) 

这个公式有许多应用.在排队论中左边表示第 n 个顾客的等待时间的极限分布（见 
6.9 节的定理).在 6.9 节例⑷中曾指出， 6.5 节的基本破产问題可以化成这个排队 
问题.在 11.7 节例⑷ 中用不同记号讨论了这个问题 .® 因此，可以在特殊情况下 
重复地推导出 (5.15) 是不奇怪的，但是在它的自然的一般背景下这个问题就变得 

①对于这个集上的亏损分布 p , 在 11.7 节中有一个相应的亏报分布 i, 它具有集中 
于 0,oo 上的密度 (a/c)(l — F(*)). 
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更简单了.从一般理论的观点来看， (5.15) 等价于克拉美的关于风险理论中破产概 
率的著名估计 .® ► 


12.6 —个组合引理 


阶梯时刻的分布的推导依赖个简单的组合引理，如果我们把这个引理分 
离出来，那么这个论证的概率部分就会更加淸楚. 

设〜，…，: r „ 是《个数，考虑它们的部分和 

so = 0, •••,«„= xi + ••• + x„. 

我们说 w :> 0是一个阶梯 相标， 如果 a u > So ,• ••,«» > S »- 1 . 即如果 S v 大于所有前 
面的部分和.如果所有的％都是正的，那么有 n 个阶梯指标，而如果所有的都 
是负的，那么就没有阶梯指标. 

考虑 n 个糖环重排 ( xj ,•••,*„), • • • ,* n - i ), 并且 

从 0 到 n - 1 给它们编号，在第 r 个排列中的部分和《以为 

a fc U) = s «+fc ~ fc = 1, •••,«-«, ( 6 0 

«n — + «fe-n+t>) k = n — v + 1,- • • ,n. 

引理 1 伋设 >0. 用 r 表示这样的循环重排的个數，使在其中 ri 是一个阶梯相标. 
那么 r 彡1,在每个这 样的桷 环重排中恰有 r •个阶梯 栺标. 

例对于 (-1,-1,0,1.10), 我们有 r = l , 给定的次序是使得最后一个部分和为极 
大的唯一 次序. 对于 （- M , 7,1), 我们有 》• = 3,第0, 2, 3个排列都有3个阶梯指 
标 • 

证选取这样的使得〜是最大值，并且如果有几个这样的指标，取 v 为最小 
的一个.换句话说， 


, • • • , > Sv—1) A v ^ Sv-fl>' * * i ^ 8 n . (6>2) 

于是由 (6.1) 可知，在第 i ; 个排列中，最后一个部分和是严格最大值，从而 n 是阶 
梯指标.因此， r 彡 1. 不失一般性，我们现在假设 n 是原来排列中的阶梯指标，即 
对于所有的 j 有 8 n > 8 i . 于是 (6.1) 中第1行的诸量< «„, (6.1) 中的第2行说明， 
为使 n 在第 I ；个排列中也是阶梯指标，当且仅当即当且仅 
当《在原来的排列中是阶梯指标.因此，若 n 是排列中的阶梯指标，则排列的个数 
等于阶梯指标的个数，引理得证. ► 

①关于利用复平面 i 的维纳- S 普夫方法的新推导见 6.5 节中引用的克拉美的 论文. （5.15) 是 
克拉美论文中的 (57). 
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弱阶梯指标也可以类似地定义，只是要把严格不等号 > 换成夂 对它们应用 
上述论证可得 

引理2 如果彡0,那么引理1也适用于弱阶梯 捎标. 

12.7 阶梯时刻的分布 

在前几节中我们把注意力集中在阶梯高度上，现在我们转向讨论阶梯时刻.令 

r „ = P {5 i < 0, • • • ， S n _i < 0, > 0}. (7.1) 

这是首次进入0^5发生在第 n 步的概率，从而 { r „} 是第一个阶梯时刻夕 i 的（可 
能是亏损的）分布.我们引入它的母函数 

T(a) = ^2 T n 8 n , 0 < a < 1. (7.2) 

n=l 

下列不平常的定理表明，分布 { t „} 可由概率 P {5„ > 0} 完全确定，反之亦然. 
它是由 E . 斯帕里 • 安德森发现的，他的巧妙而极复杂的证明已渐渐被一些作者简 
化.我们把这个定理作为我们的组合引理的一个简单推论来推导它. [一 个较强的形 
式包含在 （9.3) 中，并将在第18章中用傅里叶方法加以讨论 . 1 

定理1 

^ 137(5) =£ V p{5n > o} - (7 . 3) 

注如果在 （7.1) 和 (7.3) 中把符号 > 和 < 分别换成 彡和 <,则定理及其证明仍 
然成立.在这种情形下，表示第一个弱阶梯时刻的分布. 

证对于每个样本点考虑 n 个循环排列 （夂， …， X „, 心，…， X v _ i ), 并用 SH •‘， 
Sk v ) 表示相应的部 分和. 固定一个整数 r , 定义 n 个随机变量 如下： 如果 n 是 
Si v ) ) 的第 r 个阶梯指标，那么= 1,否则 yw = 0,对于 w = 1,对 
应的是没经重排的序列 ( S 0 ,---, Sn ), 从而 

P{y ⑴= 1} = #， (7.4) 

其中 { r < r ) } 是第 r 个阶梯时刻的分布.这个时刻是 r 个与负同分布的独立随机变 
量之和，从而是第 r 次幂 T W («) 中 s " 的系数. 

根据对称性，变量 F ⑼ 有相同的分布；因为它们只取值0和1,所以由 (7.4) 
我们得到 

r < r) = EV 1 )) = ⑴ +••■ + y ( n >). (7.5) 
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根据上节的引理，和 y ⑴+ . • -+ yw 只可能取值0和 r •，从而 

= ip { y (°> + ... + y (") = r }. (7.6) 

对于固定的 n 和 r = 右边的事件是互斥的，它们的并集是事件 { S „ > 0}. 

因此，对 r •求和，我们得到 

E ； T n r) = ^ P (5 n >0}, (7.7) 

两边都乘以并对 n 求和，我们得到 

Er( s ) = Ev p{Sn>0}> ⑽ 

这和断言 （7.3) 相同. 

系 如果尸是连续且对称的，那么 

r ( s ) = 1- VT ^ l . (7.9) 

证在 （7.3) 中出现的所有概率是相等的，从而右边等丁 • ln ( l / V T ^). ► 

只假设 

P { S n > 0} — | (7.10) 

而推广上述结果是有趣的•当 S n / a „ 的分布趋于正态分布 W 时，情况就是这样.我 
们的假设只比 （7.10) 强一点，即设级数 

f ； i [ p { S „>0}- i ]= c . (7.11) 

收敛（不一定绝对收敛)•在 18.5 节中将证明■当 F 的期望为0,方差有限时 (7.11) 
成立. 

下列定理之所以给出，不仅因为它本身的重要性，而且因为它可作为改进的陶 
伯定理的应用的一个例子. 

定理 la 如果 (7.11) 成立，那么 

P {^> n }~-^ e - c -^. (7.12) 

因此，当 P 的期望为0,方差有限时，分布 { t „} 很类似于在二项随机游动中 
遇到的分布. 



366 第 12 幸 R 1 中的随机游动 


(7.13) 


证由 (7.3) 我们看到，当 a - 1时， 


n ^l = |^[ p{s " >0> 寻 


由此推出 



y/1 — 8 


(7.14) 


左边是 (7.12) 中的概率的母函数.它们单调减少，从而根据 13.5 节中的陶伯定理5 
的最后一部分， (7.12) 是正 确的. ► 

定理2 随机游动 超向- oo , 当且仅当 


00 1 

Xj - p {5 n > 0} < oo . (7.15) 

当把 { S „ > 0} 换成 { S „ 彡 0} 时，这个准則仍然成 

证为使随机游动趋向 - oo , 当且仅当上升阶梯过程是终止的，即当且 仅当％ 的 
分布是亏 损的. 这和 r ( l ) < 1 相同. 在这种情形下，当 s — 1时， （7.3) 的两边是有 
界的. 可以看出条件 （7.5) 是充分必 要的. 把同样的论证应用于弱阶梯时刻，就可证 
明定理最后的断言. ► 

我们知道，如果 F 的期望 H <0, 那么随机游动就趋向 - oo , 但是 /X < 0组含 
(7.15) 在分析上是不明显的.这个事实的验证提供了极好的具有方法论意义的技巧 
性练习.（见习题 16.) 

这个定理有意想不到的含义. 

例 （ a ) 设 F 是严格稳定分布，且 F (0) = 6 <\. 直观上人们认为随机游动趋向 
oo , 但是事实上这个随机游动是振动型的.实际上级数 (7.15) 可化为 
因而是发散的.于是只是正常变世.但是同一论证也适用于负半轴，这说明下降 
阶梯变量负也是正常变量. 

例 （ b > 设 F 表示对称柯西分布，考虑变量 X ' n = X n + \ 产生的随机游动.和 
S' n = + «的中位数位于 n 上，直观上人们认为随机游动应很快地趋向 oo . 实际 
上概率 P {5； > 0} 也是和 n 无关的，和上例一样，我们断言此随机游动是振动型 
的. > 

定理3 阶梯时刻负有有 限期望 （且为正常变量)，当且仅当这个随机游动赵向 
oo . 在这种情形下 

lnE (^) = ln ^ A ：7> = J ^ P { S „ < 0}. (7.16) 


①我们将看到，在任何情况下鄒有乙*»-中{5„ = 0} < oo 【见 W.9 节 （c)]. 
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(在所有其他情形下这个级数发散 .） 

证从 In(l - S )- 1 中减去 (7.3) 的两边，我们 得到： 对于0 < « < 1, 

h 1 1 --~s^ = [ 一 > 0}】- (7-17) 

为使当 * — 1时左边收敛，当且仅当负是正常变量且有有限期望.右边趋于 (7.16) 
的右边，根据定理2,为使这个级数收敛，当且仅当这个随机游动趋向 oo . ► 

最后我们指出，在定理1中出现的母函数有另一种概率解释，这种解释将直接 
导致令人惊异的反正弦定律. 

定理 4 概芈 

p „ = P{Si >0,52>0,- -,5„>0} (7.18) 


的母 A 數，由 



• P(a) = rr ^) 

(7.19) 

给出，即由 

lnp ( s ) = > 0} 


给出. 

由对称性，概芈 

(7.20) 


Qn = P {5 i < 0, •. • ， 5 n < 0} 

(7.21) 

的母函數 g 由 

< 0} 


给出. （参阅习题 21.) 

(7.22) 


证我们利用 12.2 节的对偶性 引理. 由循环亊件理论可见， （7.19) 是 n 为阶梯时 
刻的概率？„的母函数，即 

Pn = P {5„ > S 0 , • ■ , Sn > S n -l}. (7.23) 

颠倒变世 A 的次序，我们就得到对偶的解释 (7.18). [实际上这已包含在/ = 0^ 
时的 （2.1) 中了 . 】 ► 

12.8 反正弦定律 

掷硬币中的机会起伏的意想不到的特点之一可用两个反正弦定律来表达（第1 
卷的 3.4 节和 3.8 节).其中第1个说明序列 S u - -,S n 中正项的数目接近于0或 
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n 的可能性要比接近于 n /2 的可能性大，而人们天真地认为正项的数目应接近于 
n /2 •第2个说明对最大项的位置也有同样的结论 成立. 现在我们来证明这些定律 
对于任意对称分布和许多其他分布也 成立. 这个发现证明了第1卷第3 章 的讨论 
的中肯性和适用性. 

在下面我们必须处理这样的麻烦事，即最大值可以被多次达到，部分和可以等 
于 0. 如果 F 是连续的，那么我们可以不考虑这些可能性，因为此时任何两个部分 
和相等的概率为 0. (建议读者只考虑这种情形 .） 对于一般理论，我们约定考虑第 
1最 大值的指标， 即这样的指标 使得 

Sk > So,-■■ ,Sk > Sk-i,Sk ^ Sk+i .• • •,5/t > S„. (8.1) 

这里 n 是固定的， fc 可取值 0,1, — n . 事件 (8.1) —定对某个 fc < n 发生，因此我 
们可以把(正常的）随机变董定义为第1个最大值的指标，即使 (8.1) 发生的指 
标.这里 So = 0. 

事件 (8.1) 要求2个事件 { S * >5 o ,---,5 fc > 和 {5 fc+1 …、 S n ~ 

S k < 0}, 同时实现.第 1 个只涉及到 A , …, A , 第2个只涉及到义 fc +1 ，…,义„, 
从而2个事件是独 立的. 但是这些事件是上一定理中出现的事件，因此我们证明了 
引理1对于所有的 A, n, 

P { K n = k} = Pkq n - k - (8.2) 

现在假设对干所有的 n , P {5„ >0} = P { S „ ^ 0} = i 于是 （7.15) 和 （7.17) 中 
的右边化为从而 

P (») = 9(«) = 1/ V 1 - 8. 

于是 

一⑵(丄卜 1 )' (83) 

这可改写成更合适的形式 

( 2k \ ( 2n-2k \ 1 ,。▲、 

Pkqn ~ k= [k )[ n~k J 2^- (8 - 4) 

这个表达式曾在第 1 卷的 3.4 节 (4.1) 中被用来定义离散的反正弦分布.在第1卷 
的 3.4 节和 3.8 节中已看出，这个分布决定了与掷硬币有关的各种随机 变量； 它的 
极限形式是在第1卷 3.4 节 (4.4) 中导 出的. 特别，利用第1卷 3.8 节 （ f ) 的反正弦 
定律，我们可以叙述 
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定理 1 如果 F 是对称且连续的，那么 KSo.Su.'Sn 中第一个最大值的指标)的 
概牟分布和掷硬币游戏中的分布一样.它由 (8.3) 或 (8.4) 给出.对固定的 0<a<l, 
当 n —♦ oo 时， 

P{i^„ < na} —* 2 • ^ arcsia y/a. (8.5) 

极限分布的密度 l/[nv/a(l-a)] 在两端点 0 和 1 上是无界的，并且在中点! 
上取得最小值.这说明约化最大值 K n / n 接近于0或1的可能性要比接近于 | 的 
可能 性大. 关于更充分的讨论见第1卷的 3.4 节和 3.8 节.关于这个定理的另一种 
形式见习题 22. 

正如上节定理1那样，这个定理也可以推广. 

定理 la ® 如果级數 

f ； i[p{S„>0>-|]=c (8.6) 

收敛，坏么当 n —* oo,n — A: —* oo 时， 



从而反正? i 定律 (8.5) 成立. 

在18. 5 节中将证明，当 F 的期望为0,方差有限时，级败 (8.6) 收敛.因此，反正弦定 
律对这样的分布都成立. 

证由 (7.20) 和阿贝尔关于幂级数的基本定理，我们可得，当 * — 1时， 

ln ( p («) Vr ^ = £ ^ [ p < s « >0}- i ] - c , (8.8) 

因此 

P (») ~ e c - ( l - a )" i . (8.9) 

根据定义 (7.18), p„ 单调《少，从而13. 5 节的陶伯定理5的最后一部分 ■ 含， (8.9) 中两个 
幕级数的系数有相同的渐近性质.于是 

Pn~e e ^ ~2 j (-1)", n -* oo . (8.10) 

对于如我们可得到同样的关系式（把 c 换成 - c ), 从而断言（8_7)可由 （8.2) 推出.反 
正弦定律的推导只依赖于渐近关系式 (8.7) 而不依赖于恒等式 (8.4). 

①斯帕里.安德森用麻煩的计算证明了这个定理. 胄伯定 理可以 m 除所有 的麻煩这一说明应归功于斯 
皮策尔.关于推广见 12.9 节 （d). 
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定理1及其证明可照搬到任意的严格稳定分布上去.如果 P { S „ > 0} = J 与 n 无关, 
那么我们可以从 （7.20) 和 (7.22) 推出 


p ( s ) = (l- 8 )- 4 , 5 ( S ) = (l- 8 ) 4 - 1 , 


从而 

咕“}-…- (一 《-(_/) ㈡ 
把 (8.5) 右边的反正弦分布换成具有密度 

0<:<1 

n ~ x y 


( 8 . 11 ) 


( 8 . 12 ) 


(8.13) 


的分布， 极 限定理 (8.5) 也成立.定理 la 可 以搬到属于一 个稳定分布的 吸引域 的分布上去. 

在第1卷第3章中我们必须分别证明两个反正弦定律，但是下列定理说明，它 
们是等价的.（关于连续分布的）定理2是 E . 斯帕里 • 安德森引进讨论起伏理论的 
新方法进行研究的出发点.原来的证明是非常复杂的.现在有几种证明，但下列证 
明似乎是最简单的. 

定理2 ，…，5„中严格为正的项的數目/7„和有相同的分布 （8.2), 是 

5 o = 0,5 w ,5„ 中第1个最大值的4旨标. 

(见习题 2 3. ) 

这个定理将化成一个纯粹的组合引理.设巧， •••,〜 是 n 上任意的（不一定不 
相等的）实数，令 

80 = 0， Sfc = XI + ••• + !*. (8.14) 


扣 ，的,中的最大值可被重复地达到，因此我们应该区别第1和最后一个最大 
项的指标. 

现在考虑 n ! 个排列 A ,，..•,〜(其中一些排列可能有相同的外形).我们把每个 
排列与它的 n + 1个部分和 O . n ,,---,**, + + 联系起来_ 

例⑷令; E! = 0： 2 = 1, X 3 =X4= -1. 只有6个重新排列 { li ,,-- -,Xi 4 } 是可区别 
的，但是每一个都表示下标的4个排列.在排列（1,1，-1，一 1) 中3个部分和是严格 
为正的，（唯一的）最大值发生在第3个位置上.在排列 (-1,-1,1,1) 中没有一个和 
是正的，但是最后一个部分和为0•第1个最大值的指标为0,最后一个最大值的 
指标为 4. ^ 

我们将证明定理2是下列引理的一个简单推论. 

引理2 设 r 是一个整教 0矣 r 彡 n •恰有 r 个严格为正的部分和的排列的数目 
等于这样的排列的数目 S r , 使得在其部分和中的第1个最大值发生在位置 f •上. 

(见习题2 4 . ) 
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证®我们利用归纳法进行证明，断言对于《 = 1是正确的，因为別 > 0殖含 
4 =历=1和也== 0,而 a : 彡0蕴含土 =氏= 0和為 ) = B 0 = 1. 假设当 
把 ri 换成 n - 1 > 1时引理是正确的.用和来表示把 》 i 元组(町， ■••, a ；n ) 
换成通过去掉: r fc 而得到的 （ti - 1) 元组时对应于木和私的数.于是归纳法假设 
说明对于1彡 * < n 和 r = 0,…，《 - 1，=成*)•这时 r = n 也正确，因为显然 
有此)=必= 0 . 

⑷假设妁+…+办 < 0. (町，…，杯）的 n ! 个排列是通过在最后一个位置上 
选择办并交换其余《_ 1个元索而得到的.第71个部分和 < 0. 显然，正部分和的 
个数以及第1个最大项的指标只依赖于前 n - 1个元索.于是 

^. = ^ A < fc) > B r = j 2^ r k) , (8.15) 

fc=i fc=i 

从而根据归纳法假设有 

( b ) 假设町+ ••• + %> 0. 于是第 n 个部分和是正的，前面的论证说明现在有 

i 4 r = (8.16) 

fc=i 

为了得到 S r 的类似的递推公式，考虑 从办开 始的重新排列 （办 ^以」.因 
为第 n 个部分和是正的，所以部分和的最大项的下标为正.显然，为使第1个最大 
值发生在位® r(l < r < n ) ±,当且仅当 (x>, , • • • *^ ) 的部分和的第1个最大值 
发生在位置 r - 1. 因此， 

Br = j 2 B r - i - (8.17) 

fc=i 

比较 （8.16) 和 (8.17) 又可看到人= B r , 这就完成了证明. ► 

我们很快可以看到，利用这个论证可得到进一步的结果，但是我们先回到 
定理1的证明我们按照 12.7 节中定理1的证明那样进行.考虑 n ! 个排列 
并且这样给它们编号，使得自然次序（別，…〜）为第 一个. 对于固 
定的整数0 < r < f », 如果第 v 个排列恰有 f 个正部分和，那么定义= 1,否则 


①下述证明应归于英国伯明翰的约塞夫 （A. W. Joseph) 先生.如果人们还记得斯帕里.安德森在1949 
年发现定理2是一个令人难以置信的*动' _-时的事件的话，那么这个证明的极墙筒明性差不多是 
令人II惊的， ® 来的证明是非常复杂的.本书作者•把它化成纯粹的粗合引理2并给出它的初等证明. 
(见本书第1版 .） 约塞夫的证明不仅比较简单，而且它是第一个建立了两类排列之间的一一对应 
的构造性证明.我们在引理3中关于这方面的讨论利用了英国伦敦的比兹利 （M. T. L. Bizley) 先 
生的想法.作者感谢约塞夫和比兹利允许他利用他们未发表的结果（是在打宇 H (稿巳交给印朗商时 
告知作者的). 
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定义= 0. 由对称性，这 n ! 个随机变量有相同的分布，从而 

P{Kn = r } = P { y (1) = 1> = E(y ⑴) = E ( y {u) ). (8.18) 

类似地 

P { AT n = r } = ^ E ( ZM ). (8.19) 

其中，如果在第 t ； 个排列中第一个最大部分和的指标为那么名 W = 1,否则 
ZW =0. 根据上一引理， 5： y ⑷与 E ^ ( w ) 是恒等的，因此 (8.18) 和 (8.19) 中的概 
率是相同的. ► 

关于斯帕里.安徳森变换的注由引理2推出，存在一种变换，它把每个 n 元实 
数组 (* i ,---, x n ) 以这样的方式映到一个重新排列上去^⑴如果在 
(8.14) 的部分和中恰有 r (0 < r < n ) 个是严格正的，那么使 ( ij ,,-• • , ii „) 的部 
分和首次达到最大值的指标是 n ( ii ) 这个变换是可逆的（或者一对一的).这样的 
变换称为斯帕里 • 安德森变换，虽然他讨论的是独立随机变贵，而且不知道可以把 
定理2化成一个纯粹组合引理 2. 细读引理2的证明可以看出它实际上包含着一 
个斯帕里 • 安德森变换的一种构造方法.这个程序是递推的，第1步由下述规则 
给出 | 如果< 0,那么不改变 n 元数组 ( H ,•••,!„), 但是如果> 0,那么把 
它换成循环重排（〜，:^，…，.第2步是把同样的规则应用于 ( n - l ) 元数组 
所需要的重新排列（而:，…， x < n ) 可在第 n - l 步后 得到. 

例 （ b ) 设 (* x ,• •,*«) = (-1,2,-1,1,1,-2). ^ 1步不发生变化，而第2步导致 
(1,-1, 2, -1,1,-2). 因为 S 4 = l , 第3步得到 （1,1,-1,2,-1,-2) ,第4步不发生 
变化，因为 S 3 = 0. 由于 S 2 = l , 所以最后一步导致重新排列（1，1,2, -1,-1,2) .部 
分和的唯一最大值发生在第3个位置上，在原来的排列中恰好3个部分和是正的. 
例 （ c ) 假设对于所有的 j , 勺 < 0. %的初始排列和最后排列是相同的.没有一个 
部分和是正的 ， so = 0 是最大值（如果幻= 0,那么这个最大值被重复). ► 

最好把上述递推构造换成对最后结果的直接描述.我们在下列引理中给出这 
种描述.由于它本身的重要性，我们给出一个不依赖于上一引理的新证明.（亦见习 
题 24.) 

引理3设（町，…， *„) 是这样的 n 元实數组，使得部分和知,，…，是正的，并 
且其他所有的部分和是负的或0;这里巩>«2 >•••>%> 0. 先写下 
然后把其余的巧桉自然顒序写在 后面. （如果所有的部分和 <0,那么 r = 0且次 
序保持不变 .） 在新的排列中，部分和的最大值中的第1个发生在第 r 个位置上， 
并且这样定义的变换是一对一的. 

证 用⑷ ，… ，匕） 表示新排列，用内，…，表示它的部 分和. 对于每个下标 ：?•$ r »， 
存在唯一的4下标 A :， 使得6=邛.特别 ，& ，…， &• 和拷 上述次序的 x vi , 



12.9 杂.录 373 


一致 • 

首先考虑使办 < 0的 j . 从其构造显然可见 j > fc , 且元素 G - fc + i , …，&是 
Xl ,-", Xk 的一个排列，于是 CTj = < Tj-k + Sfc < ( Tj - k , 因此不可能是第 1 个最大 
的部分和. 

如果 r = 0,那么在 j = 0 时达到巧中的第1个最 大值. 当 r > 0时，第1个 
最大值发生在位置0,1, •••,»• 之一上，我们来证明只有》•是可能的.实际上，如果 
j^r, 那么由其构造可以推出，％个元素&，…石 -1+4 和（町，…， M ) 的某个重 
排一致. 7■•是 aj^+yj = > Oj-u 从而在位置 j _ 1上不可能达到最大值. 

为了完成引理的证明，只需证明变换是一对一的就行了.事实上，… ，^之 
逆可以利用下列递推法则来 构造. 如果所有的巧 < 0,那么不改变这个排列.否则， 
令 A ： 是使 A > 0的最大 下标. 把⑷，…，匕）换成（匕…红,6，& + 1, ••<«), 并把 
同一程序应用于 （ fc -1) 元数组洛,…,红). ► 

关于可交换变置的注 应当注意到这个证明不依赖于变 S X , 的独立性，而只依赖于 
个排列 { X ilt - -, X tK ) 中所有的排列的联合分布是相等的这个亊实.换句话说，定《 2对 
于可交換变量的 I 个 n 元组仍然成立 (7.4 节)，虽然 A ：„ 和/7„的共同分布自然要依赖于 
Xi 的联合分布.作为一个有趣的例子，设 X U X 3 , … 是有共同分布 F 的独立变量，并令 
Y k = X k - 义 / n (其中 A : = 1,2,…, n ) .变量…， r „ 是可交换的，它们的部分和是 

Ek = Sk - kSn / n -, fc = l ,-..， n - l . (8.20) 

参阅 ( So , Sx ,---, S n ) 的图形，我们可以把&看作顶点馬到联结坭点和端点 ( n , S „) 的弦 
的垂直距离. 

我们现在假设 F 是连续的（为了避免 K 别第1个和最后1个最大值).在诸项0,及, • • • ， 
r „_ i 中以概率1存在唯一的1个最大值.对于循环重排 ( y 3 ,- -, y n > yi ) 有相应的部分和 
o ) r a -27i, - ,r„-i-27 1) -r 1 , 并且很明显，最大值 的位* 按循环的次序向前移动 i 个位 
S . (如果原来的最大值在第0个位置上，那么对于 fc = l, --,r»-l,r Jk < 0 , 并且新的最大 
值在位 a n - 1上 •） 因此，在这 n 个循环排列中，在每个位 a 上恰取1次最大值，它的位 
置均匀地分布在 0,1,.•.,»»- 1上.因此，我们有下列应归功于斯帕里.安徳森的且与第1 
卷 3.9 节中定理 3 有关的定理. 

定理 3 在具有连續分布 F 的任一 随机游动中，对任一《,负，…，沒„中位于从 (0,0) 到 

( n , S „) 的弦之上的顶点的个教均匀地分布在0, 1上. 

(这对于有最大距离的顶点的指标也成立 •） 

12.9 杂 录 


( a ) 联合分布 

只要把导致 12.7 节定理1的论证做记号上的改变，就可用来推导阶梯变童的 
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联合 分布. 改变 12.1 节的记号， 设/是 中 的区间，用 ^ r ) {/} 表示 n 是第 r 个 
阶梯时刻且 S„ € J 的概牟 .令 


H{I, S} = Y 1 anH n{I}, o < s < 1. (9.1) 

n=l 

对固定的 S 利用归纳法可得 

= (9.2) 

n=l 

利用导致 (7.3) 的论证不难得到下述应归于巴克斯特 （G. Baxter) 的结果.当 J = 
0755时，它化为 (7.3). 

定理 对于 / CW 和1, 

£ »} = E ^P{5»e/>. (9.3) 

更简单和更容易处理的形式将在 18.3 节中导出. 

( b ) 母函数 的死亡率解释 

下列解释可帮助直观理解和简化形式上的计算.对于满足0 < /» < 1的固定的 
*, 考虑 一个亏 损随机游动，它在每一步以 1-s 的概率中止，否则就服从分布《厂 
于是 8"F"*{/} 是在时刻 n 位于 J 中的概率.亏童1 - 表示在 n 前终止的概率. 
除了所有的分布都变成亏损分布外，所有的考虑可以毫不改变地搬过来.特别，在 
具有死亡率的随机游动中， (9.1) 是第一个阶梯高度的分布， （9.2) 与 9.2 节和 9.3 
节中的 H r * 类似.于是母函数 r(s) 等于发生阶梯指标的概率. 

(c) 循环事件 

{5i ^0, - ,5 n -i <0,5„ = 0} (9.4) 

表示在预先没有进入过右半轴的情况下返回 原点. 我们曾在第1节弱阶梯变贵的 
定义中考虑过它•用表示事件 (9.4) 在时刻 n 首次发生的概率，即 

w„ = P{5i < 0,…， S„_i < 0, S„ = 0}. (9.5) 

如果 O；00 = EWr« r , 那么 W 是第 r 次发生的母函数，从而 l/[l~w( 8 )] 是概率 
(9.4) 的母函数. (7.3) 的证明的简化形式可导致基本恒等式 

^ E ^-P{5n = 0}. _ 
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把此式和（7.3)、 (7.16), (7. 2 2)等进行比较，我们可以看出，从弱阶梯变量过渡到严 
格阶梯变董以及从严格阶梯变董过渡到弱阶梯变童是多么地 容易. 公式 (9-6) 也证 
实了 12.1 节中的下列 陈述： 如果 (9.4) 中的所有不等号都改变方向，那么 （9.4) 的 
概率仍然不变. 

( d ) 向任意区间的推广 

利用明显的记号改变，就可把 12.3 节的理论推广到把换成任意区间4并 
把^0换成 余集， 的情形.特别，维纳-笛普夫积分方程保持不变.请读者详细 
地研究其 细节； 它们将在 18.1 节中被充分地讨论.（也见习題 15.) 

12.10 习 题 

1. 在二项随机游动 [12.2 节例 （ b)] 中，设 e* 是这样的指标 n ^ 0 的平均个数，使得 
S „ = k,Sl > 0, --, Sn-l ^ 0( 在第1次取负值之前到达 fc ). 用/表示到达 -1 的概率， 
即如果9 > P , 那么/ = 1. 否则/ = g / p . 取点 （1, 1) 为新原点，证明 I eo = 1 + p/co 
且对于 fc > 1, e* = p ( e*_i + fe k ). 证明，对于 fc 彡 0, 

当 P > 时 e * = p _1 , 当 p < g 时 e * = [p/q) k q~ l . 

2. ( 续）对于*彡 1, 令办是这样的指标 n > 1 的平均个数 • 使得= k,Sx > 
0, --, S „- i >0 (在首次返回原点之舫到达 *:). 证明 a * = pe *_ 1> 从而 

当 时 a » = l , 当 时 a * = ( p / g )*. 

这就给出了 12.2 节例 （ b ) 中的似乎自相矛盾的结果的一个直接的证明. 

注下列习题3 〜习题 6可以作为本章的问题的导引，在学习本章前就可以解答它 
们.它们也给基本积分方程的显式解提供了例子.此外，它们说明了母函数的威力和优 
美[试直接解方程（1)!1 

3. 随机游动的变童 X * 有这样一个共同的算术分布,它对整数1, 2,…賦予概串 f u f 2 , …， 
对 -1 賦予概韦 9( 其中 9 + / i + 厶+ .. = 1. ) 用 A r ( f = l ,2 …）表示序列^，灸,… 
的第1个正项的值为 r 的概率.（换句话说， { Xr } 是第1个阶梯高度的分布 •） 证明 ■ 
( a ) A r 满足递推关系式 


Ar = /r + 9( 入 r +1 + AlAr )- 

(1) 

( b ) 母函数满足 


入⑷ °< a<i 

⑶ 

( c ) 如果 E ( X k ) =/* = f ( l )- q >0 , 那么方程 


/(«) + q / s=l 

⑻ 


存在唯一的一个根0 < <r < 1. 
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⑷ 


利用 A 在 SH： 是单调的且< 1这个事实来证明 

A ( a ) = ^ /(8) - /(g) . 
q a — a 

这等价于 

^ _ \frlT + fr+lO 3 + ■ ■ ■] 

r _ 9 

(d) 如果 E(X k ) < 0,那么在⑺中令 Xi =( l - q )/ q 就可得到一个合适 的解. 于是⑷ 
和 （5) 对于 <r = 1成立_ 

4. 对弱阶梯高度改述上题.换句话说，我们不考虑V,而考虑 S,,S a , -- 的第一个非负 
项的值为 f 的概率 (r = 0,1,…).证明I⑴和⑷可以换成 

l^r = fr+ 'i^Uo Ur+1 ' (^ a ) 

y(a) = 1 -£ + a /( 8 )-/( g ) . (4a) 


5. 在习题 3 的随机游动中（但不利用习理 3) 令 a: 是对于某个 n , 有 S „ < 0 的概率.证 
明 | i 满足方程⑶，从而 * = 

6. 績. 证明： 对于某个 n > 0,有 S„ < 0的概率是 g + f (< x ) = 1 - 9 (a— 1 - 1) .验 
ffi. •V(l) = /urte(l- < r)]- 1 , 这是关系式（ 2 . 8 )(或瓦尔德方程）的一个特殊情形. 

7. 试由 (1.12) 利用直接计算来推导 (1.13). 

8. 到达概年.对于 t > 0和$ > 0,用 G ( t ,0 表示超过 t 的第1个和$ t + { 的概率. 
证明： G 满足积分方程 


G(t,0 = F(t + «-F(t) + j + G 、 t - y,OF{d W >. 

在解不唯一的情形下， G 是最小解.阶梯高度的分布 H 唯一地由 W(0 = G(0,O 所确 

定. 

9.令 H 是集中于0^5上的连续概率分布， H— 是集中于^75上的可能为亏损的连续 
分布.假设 


H + H ~ - HirH - 1 = F 


⑹ 


是概率分布.由 12.3 节的唯一性定理可推出，和是在 F 产生的随机游动中首 
次进入点和龙-的 分布. 用这种方法可以得到 F 的形如⑹的明显表达式•当 
0 < <?彡1,并且丑和的密度由 
(a) 6e _te , 对 * > 0,丨对一1 < a: < 0, 

或 



(b) 6- 1 , 对 0 < * < fc; g, 对 -1 < □: < 0 定义时，情况就是如此.在 （a) 的情形下分布 
密度为 

f (b-q)e- bx + qe~ b(K+1 \ x > 0, 
f(x){ 

1 «e _6< * +1) > -1 < * < 0. 

在 （b> 的情形下，如果 6 > 1, 那么 F 的密度为 

{ ?6 _1 (l+a:), -1 < * < 0; 

gtr 1 ， o < * < 6 - 1 ； 

g6 _1 (6 — i), b — 1 < x < b. 

在任一情形下， 为使 F 的期望为0,当且仅当 9 = 1. 

10.由 (3.11) 证明 ：如果 //和 /T 是正常分布，并且方差有限，则 E(X,) = 0且 E(X?) = 

11. 瓦尔德关糸式 （2.8) 的分析 ii 明.利用 （3.11) 分别对 *>0 和*<0 证明， 

1 - F(x) = [1 -p(0)l[l - /?(*)] + J° + p{A V }[H{x -»)- 
P(*) = f^pidy^l-H^x-y)). 

证明 I 为使 F 的期望 fi>0, 当且仅当 H 有有限期望 《/ 且 p ⑼ < 1. 通过在=55755 
上的积分证明 ■ /* =【1 -#>(0)]^/, 这等价于 （2.8). 

12•与 12.4 节例 （c) 有关的问题.如果 m > 0,那么分母有一个正根 时 < 1,恰有 b - 1个 
复根在|«| < ao 中， a - 1个复根在|*| > 1中•把《变成1/«就可描述 n<0 的情况 • 
13. 12.4 节例 （c) 中上升阶梯高度的分布的母函败为 

X(«) = 1 - (1 - a)(l - a/«7i) … (1 - «/(7 0 -i). 

对于下降阶梯高度，把 s/a k 变成 s k /s 即可. 

14■与 12.4 节例 （c) 有关的 问薄.假设兄 取值 -2,-1,0, 1,2的概率都是 1/5. 证明， 上升 
阶梯高度的分布为 

» 1+V5 . 2 

Xl = JTVs' Aa = 3T^' 

对于弱高度，= ^(7 — >/5), Ai = ^(1 + >/5), Aa = 

15•在1 2 .4节例 （c) 中用 V>i n> 表示前 n 步走不出区间而第 n 步到达 fc 的概率.（于 
是对 fc > A 和 fc < -B^ n) =0. 照例，当 fc = 0时 < 0> = 1,否则 V4 0 ) = 0.) 令 
V-* =E4 n) 是离开 -B,A 之前在*上逗留的平均次数.证明 


V 1 * = 53 + ^* 0> . -B < fc < i4, 
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并且对于 fc > A 和 fc < - B ， 

A 

Pk = ^2 Mk- V 

是首次跑出区间 ~ B , A 的点到达*的概率.[这个问题在序贯分析中是很重要的.它说 
明了 12.9 节⑷中所述的情况 .] 

16. 12.7 节的定理2蕴含，如果 M < 0,那么 E « _ * P{Sn > 0> < oo . 试补足下列的直接 
证明.只需证明（切比雪夫） 



F { dj /} < oo , 


53 去 J_y F ^v) < 


第1个关系式是显 然的. 为了证明第2个关系式，把积分记为在 n 个区间 k--l < | V | < 
fc(fe = l ,-•-,«) 上的积分之和.類倒求和的次序，证明^整个级数 < 2 E (| X |). 

17. 对于掷硬币游戏，证明 I 

^ T p{Sn = 0} = lo 8 i + Vi -^- 


提示，注意到左边可以写成 [( l - a： a ri - liar 1 在^上的积分，证明是很容易的. 
18. 假设随机游动是瞬时的，即对于毎个有界区闻/, 

yu> = E Fn *{ / >< 0 °- 

用 12.3 节的记号，设 * = 证明更新方程 

U =*+ U-kH 


的正确性.如果 iT 是沙在负半轴上的类似测度，那么和在 (1.13) 中一样， iT = 
( 1 - 0 *. 

19. 证明 

u = 

并证明这等价于维纳- S 普夫分解式 (3.12). 

20. 试直接由习题18中的更新方程推导瓦尔德恒等式 

= E(^l)Epfi). 

2 1 •与 I 2 . 7 节的定理 4 有关的 问埋. 概率= P {5 i 彡 0,..., S „ > 0} 和忒= P{Si < 
<0} 的母函数为 


W(s) = J 爷 P{5„>0}, 

ln 9 » = f ； ^P{S„<0}. 
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22. 关于最后一个最大值.我们不考虑 12.8 节中的变置欠„,而考虑部分和 S 0 , …，3„的 
最后一个最大值的指标 / C . 利用上题的记号，证明 

P{A ：； = fc}= P ； 9 ；_ fc . 

23. 12.8 节定理2的另一形式. 5 0 ,".,5„中非负项的數自的分布和上題中的变量扣的 
分布相同.应用定理 2 于 （- X „，- X „_, ，…， -&) 来证明这个结论. 

24. 如果把 So ，…， S „ 中第1个最大值换成最后一个最大值，并把正部分和的个数换成 
Si ，…，(除去 Sb = 0) 中非负项的个数，那么 12.8 节的组合引理2仍然成立.除了 
不等号的明显改变外，证明是相同的.引理3可以同样的方式搬过来. 
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拉普拉斯变换是一种强有力的工具，但同时它们的理论的本身也有其内在价 
值，并为其他理论（例如半群理论）开避道路.完全单调函数定理和陶伯基本定理 
一直被认为是硬分析的明珠.（虽然现在的证明是简单初等的，但是这方面的先驱 
工作却匍要独创性和才能 .） 预解式 (13.9 节和 13.10 节）是半群理论的基础. 

因为本章必须适应各种各样的需要，所以为了在本章题目所容许的范围内尽 
董使各部分保持独立，并且尽可能省略其细节，我作了很大的努力.第14章可以 
作为课外读物并且可以提供例子.本书的其余部分完全和本章无关. 

尽管经常出现正则变化函数，但是我们只用到了 8.8 节中十分初等的定理 1. 


13.1 定义，连续性定理 

定义1 如果 F 是集中于 ‘0,oo 上的正常概牟分布或亏損板牟分布,那么 F 的拉普 
拉斯变换 P 是由 沈 

V(A ) =厂 e-^Ftdx}, A>0, (1.1) 

所定义的 函教.从今以后我们认为积 分区间是闲的 (并且可以换成 ^5^5). 每当我 
们谈到分布 F 的拉普拉斯变换时，我们自然认为 F 是集中于0^5上的.与通常一 
样，我们延伸语言，谈及“随机变 SX 的拉普拉斯变换”，其含义是它的分布的变 
换.于是利用普通的期望的记号，我们有 

( 1 . 2 ) 

例⑷设 A •以概率 po , Pl ，…取值0,1，….于是 WA ) = EPne - nA , 而母函数是 
POO = EPn « n - 因此， V »( A ) = P ( e - A ), 拉普拉斯变换与母函数的不同之处仅在于 
变量替换《 = 这说明为什么拉普拉斯变换的性质与母函数的性质那么相似. 

例 （ b ) 密度为 f a ( x ) = ( F - Vixyy * 的 r 分布的变换是 

v - w = r5or e " li+0 * x °" ， ,iI= (XTTF' a>0 - ⑽ 

下一定理说明，分布可由它的变换来 确定. 若没有这一点，拉普拉斯变换的用 
途将是很有限的. 
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定理1 (味一性 .） 不同的概牟分布有不同的拉普拉斯变换. 

第一种证明在 8.6 节 (6.4) 中我们有这样一个明显的反演公式，使得在巳知 F 的 
变换时我们可以用此公式来计算 F . 我们将在第4节中重新推导这个公式. 

第二种证明 设 y = e - *. 当 a ; 从0变到 oo 时，变董 j /从1变到 0. 我们现在通过 

在连续点上令 G ( y ) = 1 - F ( x ) 来定义一个集中于上的概率分布 G . 于是 

V ( A ) = I " e - A * F { dx } = jf 1 ^ Gidy }, (1.4) 

此式由下列事实来看是显 然的： 黎曼和 ^(*01 与 yfc = e -办 时 
的黎曼和 El / fc [ G ( l / fc )-<?( y fc + i )] 一致.由 7.3 节我们知道分布 G 由它的矩唯一确 
定，这些矩 由沪⑻ 给出.于是 P (1), V »(2), …确定了 G , 从而确定了 F . 这个结果比 
本定理的断言更强 .® ► 

下列基本结果是定理1的简单推论. 

定理2 (违 埃性定理）对71=1，2,...,设&是变换为％的概芈分布 • 

如果 -» 其中 F 是变换为 p 的可能为亏捐的分布，那么对于 A > 
0, v » n ( A )-» y >( A ). 

反之，如果对每个 A > 0,序列 ( v > n ( A )} 收敛于一个极限 < p ( X ), 那么 V 是一个 
可能为亏损的分布 F 的变換，并且 — F . 

极限 F 不是亏损的，当且仅当 A — 0 时， —1. 

证第1部分已包含在 8.1 节的基本收敛定理 中了. 对于第2部分，我们利用 8.6 
节的选择定理1•设是一个收敛于一可能为亏损的分布 F 的子序列.根据定 
理的第1部分，这些变换收敛于 F 的拉普拉斯变换.由此推出， _ F 是拉普拉斯变 
换为 V 的唯一分布，从而所有收敛的子序列收敛于同一极限 R 这蕴含 F „ 收敛于 
/^.由 (1.1), 定理的最后断言是显然的. ► 

为了叙述清楚，我们尽可能使字母 F 只表示概率分布，但是代替 （1.1), 我们 
考虑形如 ^ 

w ( A ) = jT 0 ° e - A * C ；{ dx } (1.5) 

的更一般的积分，其中 C / 是对有限区间 J 賦予有限质童 U { I }, 但可以对正半轴賦 
予无限质贵的 测度. 照例，我们可以利用由 U { x ) = U { X ^} 定义的非正常分布函 
数来方便地描述这个测度.在 f ； 是某一函数的积分这一重要特殊情形下，积 

①更一般地说，一个完全单调函数由它在使 DC 1 发*的点列 {On} 上的值唯一碗定.然而，如果 
收敛，那么存在两个不同的完全单调 函败， 它们在所有的点 o„ 上*重合.关于这个著名定 
理的初等证明，见 W. Feller, On Muntz' theorem and completely monotone functions, Amer. 
Math. Monthly, vol. 75(1968)pp. 342-350. 
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分 （1.5) 化为 

= f e _ Xx u ( a :) da :. (1.6) 

Jo 

例 （ c ) 如果 u (*)= x °, 其中 a >- l , 那么对于所有的 A >0, w ( A )= r(o + l )/ A ° +1 . 
例 （ d ) 如果 u (: c ) = e «, 那么对于 A > a > O j (1 ;( A ) = 1 /(A - a ), 但是积分 （1.6) 对 
A < a 发散 • 

例 （ e ) 如果“ ㈤ = 〆 ，那么积分 （1.6) 处处发散 • 

例 （ f ) 由 （1.1) 通过微分得到 

■ VW = re -^ xFldx ), (1.7) 

Jo 

这是一个形如 （1.5) 的积分，其中 U { dx } = xF { dx }. 这个例子说明形如 （1.5) 的积 
分在与正常概率分布有关的问题中是怎样自然地出现的. ► 

我们将主要对从概率分布 通过简 单的运算导出的测度 感兴趣， (1.5) 的积分 
一般说来对所有的 A > 0都 收敛. 但是排除只对某些 A 收敛的测度，我们也得不到 
什么东西•由于 w ⑷ < 00 蕴 含对于所有的 A > o , w ( A ) < oo , 从而使 (1.5) 中的积 
分收敛的 A 的值充满区间 aToo . 

定义2设 C/ 是一个集中于 W 上的 測度. 如果 （1.5) 中的积分对入> a 收敛，那么 
对入> a 定义的函教 w 称为的拉普拉斯变换. 

如果 t/ 有密度 u, 那么 [/ 的拉普拉斯变換 (1.6) 也称为 U 的普遢拉普拉斯变 
换. 

上一约定只是为了方便才引 入的. 如果要进行系统的讨论.我们应考虑形如 

j 。 e -> * v (*) l /{ da :} (1.8) 

的更一般的积分，并称它们为 > 关于测度1/的拉普拉斯变换”.于是 （1.6) 是“ u 关于拉 
普拉斯测度（或普通长度）的变换 *. 这有一个理论上的优点，即可以考虑可改变符号的函 
数 U 和 t ;. 为了本书的目的，最简单且最准确的方法是只把拉普拉斯变换和测度联系起来， 
我们将这样做.① 


①术》还未统一，在文献中术语*尸的拉普拉斯变换_既可指 (1.1), 也可相 (1.6). 我们把 （1.6) 称 
为•分布函败 F 的普通拉普拉斯变换》,但是，主要讨论这种变换的书通常省略了隈制词“普通” . 
为了在这些情形下不发生混淆，我们 ft ： 变換 (1.1) 为拉普拉斯斯蒂尔切斯 （ Lapla ^ Stieltjes ) 变 
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如果 1/ 是一个使 (1-5) 中的积分对 A = a 收敛的测度，那么对所有的 A > 0, 

w(A + a )= /°° e - A * e - ai y { dx }= e -^ U * { Ax } (1.9) 

Jo Jo 

是有界测度 U *{ dx } = e -^ Uidx } 的拉普拉斯变换， w(A + a)Mo) 是一个概率分 
布的拉普拉斯变换.每个关于概率分布的变换的定理可以用这种方法推广到一类更 
广泛的测度上去.由于新变换 ^(A + a ) 的图形是由 a ; 的 图形经 过平移得到的，所 
以我们把这个极有用的方法称为平移原理.例如，因为1/唯一地由确定，且 
U * 唯一地由 A>0fi«Jw(A + a) 确定，所以我们可以把定理 1 推广如下. 

定理 la —个測度由它在某区间 a < X < oo 上的拉普拉斯变换 (1.5) 的值唯 
一确定 - 

系一个连埃 A 教 u 由它在某区间 a < A < oo 上的普通拉普拉斯变换 （1.6) 的值 
咪一确定. 

证变换唯一地确定了 u 的积分两个不同的连续®函数不可能有相同的积分. 


| 一个用 tv 表示 u 的明显公式已在 7 . 6 节 (6.6) 中给出 •] 

连续性定理可类似地推广到具有拉普拉斯交换的任意测度 {/„ 的序列上去 . 

有拉普拉斯交换这个事实蘊含对于有限区间 I , Un { I }< oo . 我们由 8.1 节和 8.6 节 
知道，为使这样的测度序列收敛于一个 W 度当且仅当对于的每个有限连续 
区间， U „{ I } -» U { I } < oo. 

定埋 2 a (广义连埃性定理. ） 对于^二^^^设仏是具有拉普拉斯变换^^ 
的 測度. 如果对于 A > a , u »„( A ) —► w ( A ), 那么 w 是一个測度 t / 的拉普拉斯变换， 
并且 -» £/■ 

反之， 如采 U n — U 且序列 { w „( o )} 是有界的，那么对于 A > a ， w „( A ) — w ( A ). 
证 ( a ) 假设 t /„ - ⑷ < A 如果 f > 0 是 1/ 的连续点，那么 

re - ( A + a ) l l / n { di > - [ l e -^+^ Uidx }, (1.10) 

Jo Jo 

左边与 w„(A + a ) 之差至多为 

r e -( A + °)-^ n { dx } < Ae ~ xt , (1.11) 

Jo 

选取充分大的 * 可使上式 < e . 这就是说， u；„(A + a ) 的上、下极限之差小于任意的 
e , 因此对于每个 A >0, 序列 { w n (A + a )} 收敛于一个有限的极限. 


® 同一论证说明，一般说来，除一零测集外， U 是礴定的. 
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(b) 假设对于 入 > a, w n (A) w(A). 对于固定的 Ao>o, 函数 w„(A+Ao)/w„(Ao) 
是概率分布 U*{dx} = 的拉普拉斯变换.因此，根据连续 

性定理，[疗收敛于一个可能为亏损的分布这殖含 t/„ 收敛于一个这样的测 
度 U, 使得 U{dx} = w(\o)e^ x U*{6x}. ► 

下列例子说明了 {w„(o)} 有界这个条件的必要性. 

例 （g ) 设％对点 n 賦予质 量 〆 ， 对于 n 的余集賦予重董0.因为 U n {^n}=0, 
所以我们有 Wn — 0,但是对于所有的 A > 0,w n (A) = e n ("~ A ) 〜 oo. ► 

我们有时谈到具有两个尾部的分布 F 的 a 倒变換，即 

= j: e-^FIdx}, (1.12) 

但是这个函数对任一 A#0 都不一定存在.如果它存在，那么常称 V (-A) 为矩母函数，但 
实际上它是序列 {HT.M} 的母函数，其 中洳是 n 阶矩. 


13.2 基本性质 

本节我们列举拉普拉斯变换的最常用的性质，与母函数的类似性是明显的. 

⑴ 卷积. 设 F 和 G 是概率分布， I ；是它们的卷积，即 

U » L 吻一 (2- 1 ) 

相应的拉普拉斯变换服从乘积法則 

ui = ipu. (2.2) 

这等价于下面的 断言， 对于独立随机变董， E ( e ^+' ， )) = E ( e -« c ) E ( e - w ), 这是期 
望的乘积法则的一个特殊情形 .® 

如果 F 和 G 有密度/和那么 I ；的密度为 

«(*)=/ g(x - y ) f { y ) dy , (2.3) 

Jo 

乘法法则 (2.2) 可应用于 /, s 和 u 的“普通”拉普拉斯变换 (1.6). 

我们现在来说明，乘法法则可以推广如下.设尸和 G 是具有对 A > 0收敛的 
拉普拉斯变换#和"的任意測度.那么卷积 [/ 的拉普拉斯变换 w 由 (2.2) 给出.这 
特别地电含乘法法则可应用于任意两个函数/和 S 及其卷积 (2.3) 的“普通”变换. 

①其逆是错误的：两个相依变量的和的分布可能由卷积公式给出.[见 2.4 节 （ e ) 和 3.9 节的习題 1. 1 
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为了证明这个断言，我们引入一个有限测度 F „ ,它是用如下方式截断 F 得到 
的 | 对于 a ： 彡 n , 我们令 F n ( x ) = F ( x ), 但是对 x > n 我们令 F n ( i ) = F ( n ). 可以 
通过截断 G 来类似地定义 G „. 对于 a ： < r », 卷积队 = F „ * G „ 与 L / 相同，从而 
不仅有 — F 和 G „ — G , 而且有17„ — C /. 对于相应的拉普拉斯变换，我们有 
w „ = 令 n — OO 就得到断言 W = ¥«/• 

例 （ a ) r 分布 .13.1 节例 （ b ) 中的卷积法则 f a *fp = f a + 0 反映在明显的关系式 
< Pa < P $ = ¥>«»+沒中 • 

例 （ b > 幂.对于 《„(*) = ^- l / T ( a ), 有一个相应的普通拉普拉斯变换 u ; a ( A ) = 
A -°. 由此推出和卹的卷积 （2.3) 由 u a +0 给出. 因为 Va ( A ) = w a (A + l ), 所以 
上例可由此结果利用平移原理推出. 

例 （ c ) 如果 a > 0,那么 e - *** w ( A ) 是分布*數为 1/(* - a ) 的測度的拉普拉斯变换. 
这从定义来看是显然的，但也可以看作是卷积定理的特殊情形，因为 e -^ 是集中 
于点 a 上的分布的变换. 

( ii ) 导数与矩.如果尸是一个概率分布，#是它的拉普拉斯变换 (1.1), 那么 <p 
具有各阶导数，它们由下式 给出： 

= [ e '^ x - FIda :} (2.4) 

(与平常一样 ， A >0). 我们可以在积分号下取傲分，因为新的被积函数是有界连续 
函数. 

由此特别地推出，有有限的 n 阶矩，当且仅当存在有限的极限 〆 n ) ⑼.因此， 
对于一个随机变 MX , 利用发散情形下的明显的约定，我们可以记 

E ( X ) =⑼， E ( X 2 ) = ⑼. (2.5) 

微分法则 (2.4) 对任意的测度 F 仍然成立. 

( Hi ) 分部积分.在 (1.1) 中利用分部积分法可得 

jT e -^ F^dx = A >0. (2.6) 

对于概率分布，有时最好利用尾部来改写 (2.6), 

厂 6-^[1 - F ( x)]Ac = : (2.7) 

它对应于第1卷 11.1 节 (1.6) 母函数公式. 

( iv ) 尺度的改变•由 (1.2) 可得，对于每个固定的 a > 0有 E ( e - oA *) = > p { aX ), 
从而 < p ( a \) 是分布 F { dx / a } [分布函数为 F (; r / a ) l 的变换.这个关系式被经常 利用. 
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例 （ d ) 大数定律 •设叉•.是 有 相同的拉普拉斯变换 p 的独立随机变童.假设 
E ^) = /* •和& + •••+：¥„ 的拉普拉斯变换 为，. 因此，平均值 [Xx + .-.+ XJ/n 
的变换为 < P n ( X / n ). 在原点附近 ¥>( A ) = 1 -M + 0 ( A ) [见 (2.5)], 从而当 n — oo 时， 

limp" ( 会 )= lim (1 - 令 ) = e _<i \ (2.8) 

但是 e - M 是集中于 m 上的分布的拉普拉斯变换，因此闪+…+ X n ]/ n 的分布趋 
于这个 极限. 这是辛钦弱大数定律，它不要求方差存在.确实，其证明只能直接应 
用于正变量，但是它说明了拉普拉斯变换方法的优美. ► 

13.3 例 

例 （ a ) 均匀分布 .设 F 表示集中于0^上的均匀分布 • 它的拉普拉斯变换为 
V >( A ) = (1 - e - A )/ A . 利用二项展开式可见， n 重卷积 F -* 的变换为 

V » n ( A ) = f ^(- l) fc (3.1) 

因为是对应于 £；( x ) = x n /n\ 的变换，所以 13.2 节例 （ c ) 说明 e - Afc A ~" 对应于 
(X- k)l/nl, 其中; r + 表示这样一个函数，当 z < 0时它等于0,当 z > 0时它等于 
*. 因此， 

= ^ E (- D fc (*)(®- fc )+- (3-2) 

我们在 1.9 节 (9.5) 中利用直接计算导出过这个公式，在第1卷第11章的习题20 
中也用取极限的方法导出过这个公式. 

例 （ b ) 指数为$的穗定分布.分 布函数 

G ( x ) = 2[ l - m ( l / y / x )], x >0 (3.3) 

(其中饥是标准正态分布）有拉普拉斯变换 

7(A) = e -^. (3.4) 

这可用初等的计算来验证，但是这些计算是相当冗长的，我们最好用第1卷 3.7 节 
中的极限定理3来推导 (3.4). 在这个定理中，我们首次遇到了分布 G . 考虑简单 
的对称随机游动（掷硬币)，用 T 表示首次返回原点的时刻.所引用的极限定理指 
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出， G 是正规和 m + H . + IU / n 2 的极限分布，其中 Alb ， …是与 r 同分布的独 
立随机变量.根据第 1 卷 11.3 节 (3.14), T 的母函数为/⑷= 1 - 因此 

7 ( A ) = lim [ l - y / l - e - 2 Vn *]» = lim |l - 字] = e - ^. (3.5) 

我们曾经多次说过 G 是一个稳定分布，但是直接通过计算验证是麻 烦的. 现在 
显然有 7 n W = 7 (« 2 A ), 这和 G n *( x ) = G ( n ~ 2 x ) 相同，这样我们毫不费力地证明 
了稳定性. 

例 （ c ) 幂级数与混合 •设 F 是一个拉普拉斯变换为 < p ( X ) 的概率分布.我们一再 
遇到形如 ^ 

G = f ^ PkF k * (3.6) 

fc=o 

的分布，其中 { p *} 是一个概率分布.如果 p («) = EPfcfi * 表示的母函数，那 
么 G 的拉普拉斯变换显然为 

7(入)= f > 邦)= P ( fW )- (3-7) 

fc =0 

这个原理可以推广到具有正系数的任意幂级数上去.我们转向特殊的应用. 

例 （ d ) 贝塞尔*數密度•在 2.7 节例 （ c ) 中我们曾看到，对于 r = 1,2 •…， 密度 

Vr(x) = e - x ^/ r ( x ) (3.8) 

对应于一个形如 (3.6) 的分布，其中 F 是一个满足 <p(X) = 1 /(A + 1) 的指数分 
布， { Pfc } 是普通对称随机游动中首次通过点 r > 0的时刻的分布.这个分布的母函 
数是 p 

[见第1卷 11.3 节式 (3.6)]. 代入《 = (1 + A )- 1 , 我们得到概牟密度 (3.8) 的普遢拉 
普拉斯变换为 

[A + l - v/(A + l ) a - l ] r . (3.10) 

我们只对 r = 1,2,…证 明了外 是一个概芈密度，且 (3.10) 是它的拉普拉斯变 
换.但是，这个结论对所有的 r > 0都是正确的 ®. 它具有概率意义，因为它蕴含卷 
积公式 v r * v , = v r + a , 从而蘊含 《 r 的无穷可分性•（见 13.7 节 •） 

~①这个结果应归功于韦伯 （ H . Weber ). 他给出的极其困难的分析证明现在巳被 J . Soc . Industr . Appl . 
Math ., vol . 14(1966) pp . 864-875 中的初等证明所代替. 
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例 （ e ) 另一个贝塞尔密度.在 (3.6) 中取 F 为满足 ^( A ) = 1/( A +1) 的指数分布， 
取 { P *} 为满足 P («)= e - t + t * 的泊松分布.容易明确地计算 G , 但是这个任务幸好 
巳在 2.7 节例 （ a ) 中完成了.我们在那里曾看出， 2.7 节 （7.2) 中所定义的密度 

w p (x) = e-^y/^/tyi^y/tx) (3.11) 


是我们的分布 G 与 r 密度 f liP +1 的 卷积. 由此推出， u ； p 的普通拉普拉斯变换是我 
们的7与 A . P +1 的变换 （A + 1 严 1 的 乘积. 因此，概率密度 （3.11) 的拉普拉斯变换 
为 

_ 1 ( 入 + 1 ) (O 19 、 

(A + l ) H - i e ( 312 ) 

对于 t = 1,利用平移法则 (1.9) 可以看出， V ^ I p {2 y / x ) 的普通拉普拉斯变换为 

A - p - l e l /> 

例 （ f ) 指数密度的混合.设密度/具有形式 

/(*) = ^2 pka k e ~ akX , p k > 0, = 1, (3.13) 

fc=i fc=i 

其中为确定起见，假设0 < 叫< ••• < 0„. 对应的拉普拉斯变换为 

咖=|^念=截， （3.14) 


其中 P 是一个根为 - ai ，…， - a „& n 次多项式， Q 是一个 n -1 次多项式.反之， 


对于任意一个 n - 1次多项式 Q , 比 Q ( A )/ P ( A ) 有形如 (3.14) 的部分分式展开式, 


其中 


OrPr 


Q(-Or) 


(3.15) 


[见第1卷 11.4 节 (4.5)]. 为使 (3.14) 对应于一个混合 (3.13), 当且仅当 p r > 0 K 
Q (0)/ P (0) = 1.由 P 的图形显然可见，/^-知）和户(一知 +1 ) —定具有相反的符号. 
因此，以-知）和 Q (- Or +1 ) 也一定有相反 符号. 换句话说， Q 必定在 - Or 和 - a r+ i 
之间有一个根 -6 r . 但是，因为 Q 不可能有 n - 1个以上的根 - t « r , 所以这些根一 
定满足 


0 < a! < 6i < a 2 < &2 < < 6„_1 < a„. (3.16) 

这就保证了所有的 p r 是同号的，我们得到了下列结论> 设 P 和 Q 分别是 n 次和 
«-1 次多项式，并且 Q ⑼ /F(0) = 1. 为使 Q(A)/P(A) 是指數密度的某一混合 (3.13) 
的拉普拉斯变换，当且仅当 P 的根-知和 Q 的根 -& r 是互不相同的，并且（以适 
当的编号）满足 (3.16). > 
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13.4 完全单调函数，反演公式 

正如我们在 7.2 节中所看到的那样， 为使 UJ 上的函数/是一个正序列 {/„} 
的母函数，当且仅当/是绝对单调的，即只要/为无穷可微的且其各阶导数均为 
正的. 对拉普拉斯变换也有类似的定理，所不同的只是现在的导数的符号是交错的. 
定义1 _上的一个函數是完全单调的，如果它的各阶导數均存在，并 
且 

(- l ) V n> (<\) > 0， A >0. (4.1) 

当 A — 0时 V ( B ) ( A ) 趋近于有限或无限的极限，我们把它表示为 ^ ( n ) (0)- 典型 
的例子是 1/ A 和1/(1 +入). 

下述优美的定理（为 S . 伯因斯坦在1928年得到的）是许多研究的出发点，其 
证明已经逐步地被简 化了. 我们能够给出一个极其简单的证明，因为作为大数定律 
的推论而得到的 7.2 节的定理 2 中关于母函数的特征的叙述已为它打下了基础. 
定理1 为使上的函教¥>是一个概牟分布 F 的拉普拉斯变换，当且仅当它 
是完全单调的，并且 ¥>(0) = 1. 

我们将证明这个定理的一种变形，这种变形以更一般的形式出现，但是它实际 
上可借助于 (1.9) 中所述的平移原理由原来的形式（定理 1) 导出. 

定理 la 0^5上的函數¥>是完全单调的，当且仅当它具有如下 形式： 

< p (\) = J \~^ F { dx }, (4.2) 

其中 F 不一定是0^5上的有 fjl 測度. 

(按照最初的约定，积分区间是闭的； F 在原点的可能的原子使得 v ?( oo )>0.) 
证条件的必要性可像在（ 2 .4)中那样用形式微分推出.假设 p 是完全单调的，对 
于固定的 a > 0和0 < « < 1,把 “a - aa ) 看成是 s 的函数.它的各阶导数显然是 
正的，根据 7.2 节的定理2,泰勒展开式 

(4 . 3) 

n =0 " 

对《 < 1成立.于是 

< Pa (入)= < P(o — ae - V «) = (-°) n y ( n ) ( a ) c - nA/a (4 4) 

是一个对点 n / a 賦予质量 (- a ) V n ) ( a )/ n !(»+ n = 1,2，...）的算术测度的拉普拉 
斯变换_于是当 a -> oo 时 < p a (入)— < p (\). 因此，根据广义连续性定理，存在这样的 
—个测度 F , 使得 F , 并且 p 是它的拉普拉斯变换. ► 
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我们不但证明了定理 la , 而且关系式 F a ^ F 可以改述成重要的 
定理 2 (反演 公式) 如果 （4.2) 对于 A >0 成立，那么在所有的连续点上®， 


这个公式具有重大的理论意义，并且利用它可以得出许多结论.下述有界性准 
则可以作为一个对半群理论特别有用的例子.（见 习题 13.) 

系为使 p 具有形式 

v ( A )= r ^ fix ^ x , (4.6) 

Jo 

其中 0</< C , 当且仅当对于所有的 a >0, 


n ! a 


(4-7) 


证在 (4.6) 的两边取微分，我们得到 （4.7) [见 (2.4)]. 反之， (4.7) 叛含 f 是完全 
单调的，从而是一个测度 F 的变换.把 (4.7) 代入 （4.5), 我们可得，对于任一对 

XI < 12 , 

jF(a：2) - ^(*i) ^ C(ar 2 - Xi). 

这就是说， F 有有界差商，因此尸是一个函数 f < C 的积分（见 5.3 节). ► 

定理1导致了一个检验一给定的函数是不是一个概率分布的拉普拉斯变换的 
简单方法.标准的技巧可用下列准则的证明来说明. 

准则 1 如果和分是完全单调的， 那 么它们的乘积也是完全单调的. 

证我们用归纳法来证明，娜的导数的符号是交 错的. 假设对于每对完全单调函 
数的也喊的前》个导数的符号是交 错的. 由于和-少是完全单调的，所以 
归纳法假设可应用于乘积和-从 -MY =-外- ㈣ 1 我们可得，# 
的前 n + 1个导数的符号是交错的.因为这个假设对 n = 1显然是正确的，从而这 
个准则得证. ► 

利用同样的证明可以得到下列有用的 

准则 2 如果 p 是完全单调的 ，矽 是一个有一完全单调导数的正 兩敷， 那么 ip ( r (>) 
是 完全单调的.（特别，是完全单调的 • ） 

典型的应用将在 13.6 节和下例中给出，此例经常以不必要的复杂形式出现在 
文献中. 


①反濟公式 （4.5) 在 7.6 节 (6.4) 中作为大败定律的直接推论黉被导出过•在 7.6 节 (6.6) 中对形》 
(4.6) 的积分（其中/为连续的，但不一定是正的）我们有类似的反濟公式. 
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例 （ a ) — 个出现在分支过程中的方程 .设妒是一个期望为0 < m < oo 的概率分 
布尸的拉普拉斯变换，并设 c > 0. 我们来证 明方程 


^( A) =¥ >(A + c - c ^( A )) (4.8) 

有唯一的一个根 _ 彡1,并且卢是一个分布 B 的拉普拉斯变换._8是正常分布， 
当且仅当否則 B 是亏損分布 • 

(关于应用和参考文献见 14.4 节 .） 

证 对于固定的 A >0 和考虑方程 

< P(X + c - cs )-8 = 0. (4.9) 

左边是一个凸函数，它在 a = i 上取负值，在 s = 0上取正值.由此推出存在唯一 
的一个根. 

为了证明根 0(\) 是一个拉普拉斯变换， 令 0 o = Q ， 并递推地令 九 +1 = v>(A + 
c - c 0 n ). 千是因为¥>是递减的，所以这蕴含 A < A < 1,根据归 
纳法知九< A .+1 < 1. 有界单调序列 {0 n } 的极限满足 （4.8), 从而有/3 = lim ^. 
/3 i ( A ) = v(A + c ) 是完全单调的，利用准则2可以递推地说明灸，/%，〃.是完全单调 
的. 根据连续性定理，极限0也是完全单调的，从而0是一个测度 S 的拉普拉斯 
变换.因为对于所有的 A ,^( A ) 矣1,所以 B 的 总质董 /3(0) < 1. 剩下的工作是确定 
在什么条件下; 9(0) = 1. 

根据构造， s = m 是方程 

< fi(c - cs )-8 = 0 (4.10) 

的最 小根. 看作 s 的函数，左边是 凸的； 当 s = 0时它是正的，当《 = 1时它等 
于 0. 因此，为使方程存在另外一个根 * < 1,当且仅当在 s = 1上即当且仅当 
- c ^(0) > 1,导数是正的.在其他情况下 ，点 (0) = 1,/3是一个正常概率分布 S 的拉 
普拉斯变换.因此， 为使 B 是正常分布，当且仅当 - cv /(0) = CA i < 1. ► 

13.5 陶伯定理 

设 t / 是一个集中于0^5上的测度，而且它的拉普拉斯变换 

w ( A )= r e-^U { Ax } (5.1) 

Jo 

对任意的 A > 0 都 存在. 利用由 U ( x ) = U {0 ^},x > 0 定义的非正常分布函数来 
描述 U 将是很方便的.我们将看到，在相当一般的条件下， w 在原点附近的性质唯 
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—地确定了 U ( x ) 在 a : — 00 时的渐近性质，反之亦然.在历史上任何用 w 描述 E 7 
的渐近关系式都被称为陶伯定理，而用 U 描述 w 的性质的关系式通常被称为阿贝 
尔定理.我们将不区分这两类定理，因为我们的关系式将是对称的. 

为了避免不雅观的包含倒数的公式，我们引入两个以 

tr = l (5.2) 


相联系的正变董 f 和 T. 于是当 f — 00 时 T - 0. 

为了理解陶伯定理的背景，要注意，对于固定的 t , 在 (5.1) 中引入变景替换 
* =印可知， w ( t \) 是对应于非正常分布函数 U { ty ) 的拉普拉斯变换_因为 w 是递 
减的，所以可以找到这样一个序列 n , T 2 ，…—0,使得当 t 跑过这序列时有 

7 W , (5.3) 


并且 7( A ) 至少对于 A > 1是有限的.根据广义连续性定理，极限7是一个测度 G 
的拉普拉斯变换，并且当 t 跑过倒数 h = 1/作时，在 G 的所有连续点上有 


U ( tx ) 

w(r) 


^G(x). 


(5-4) 


对 ！ r = 1可以看出 U ( t ) 在 t — 00 时的渐近性质和 w ( r x ) 的性质有密切关系. 

在原则上我们可以把这个事实叙述成一个包罗万象的陶伯定理，但是这样的 
一个定理在实际中没有什么用处.为了得到适当的简化，我们只考虑使 （5.3) 对 
任一种逼近 r — 0都成立的情形，即 w 在0点正则变化的情形_ 8.8 节的基本引 
理®1指出，极限7必然具有 7( A ) = A 的形式，其中 p > 0. 对应的测度为 
G ( x )= x »/ r(p + l ), (5.4) 蕴含[/是正则变化的，且 o ; 和的指数的绝对值相同. 
我们把这个重要结果和它的逆叙述成 

定理1 设 t/ 是一个測度，且使得其拉普拉斯变换对 A >0都存在.那么关系式 


和 


是等价的，且都殖含 


繫-去， T ^ 0 

(5.5) 

縈-，一 

(5-6) 

w ( r ) ~ J 7 ⑴ r ( p + 1). 

(5.7) 


①这个弓 I 理只被用来说明关系式 （5.5) 和 (5.6) 的不自然的形式的合理性.本节没有用到正则变化 
理论[除了 (5.18) 建含 (5.16) 这个次聲结果以外 
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证⑷假设 (5.5) 成立.左边是对应于 U(tx)/u(T) 的拉普拉斯变换，根据广义连 
续性定理，这蕴含 


U ( tx ) xP 

^( t ) — r(p+i). 


(5.8) 


对 : r = l , 我们得到 (5.7), 把这个关系式代入 (5.8), 我们得到 (5.6). 
( b ) 假设 (5.6) 成立.取拉普拉斯变换我们得到 


fa>(rA) — r (/>+ 1) 

~ UW ~* ~^~ 


(5.9) 


只要广义连续性定理可以应用，即只要左边对某个 A 是有界的.正如在 （ a ) 中那样 
可得 (5.9) 组含 （5.7) 和 (5.5). 因此，为了证明此定理，只褡验证 w ( r )/ t / ⑴是有界 
的就行了. 

用点 t , 2 t , 4 t , …划分积分区域，显然 


w(r)< Y i e~ 2n ~ 1 U(2 n t). 


(5.10) 


由 (5.7) 可知，存在这样的 t 0 , 使得当 * > to 时， U (2 t ) < 2^ l U ( t ). 重复利用这个 
不等式可得 

截 -’， (5.11) 

因此左边在 t — oo 时确实是有界的. ► 

例⑷为使当 I — OO 时 £/(®)~ ln 2 x , 当且仅当 A 4 0时 w ( A )~ ln 3 A . 类似地， 
为使 f / ⑻〜 v / i , 当且仅当 w ( A ) 〜 

例 （ b ) 设 F 是一个拉普拉斯变换为 p 的概率分布.测度 U { dx } = * F { dx } 的拉 
普拉斯变换为 -於 因此，如果当 A — oo 时， - y ( A ) 〜 m a -〃， 那么 

U ^ = lo yF ^ dy ^ ~ T(p+l) xP, x ~*°°- 

反之亦然.这就推广了微分法则 （2.4), 此法则巳包含在 p = 0时的 (5.7) 中了. ► 
有时知道当 p -* oc 时本定理在怎样的范围内仍然成立是很有用的.我们以下 
列的系的形式来叙述这个结果. 

系如果对于某个 a >1,当 t—*oo 时， 


表者键- 0 ，表者 im ^ 00 ' 


(5.12) 
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那么 



证 (5.12) 中的第1个关系式蕴含：对于 A > a , u ;( rA )/ a ;( r ) ^ 0. 根据广义连续 
性定理，对于所有的 I > 0, U(tx)/co(T) — 0.由 (5.12) 中的第2个关系式可得到 
(5.13), 因为 

rat 

w ( r ) > J e ~ x ^ U { di } ^ ( ta ). ► 

在应用中用缓慢变化来叙述定理 i 将更方便.我们知道，一个定义于0^5上 
的正函数 L 在 oo 处是缓慢变化的，如果对于每个固定的 or , 

- 1， t -» 00. (5.14) 

i 在 0 点是缓慢变化的，如果当 * — 0 时上面的关系式成立，即如果 L(1/;e) 在 00 
处是缓慢变化的.显然，为使 t / 满足 (5.6), 当且仅当在 oo 处是缓慢变化 
的，类似地，为使 (5.5) 成立，当且仅当在0点是缓慢变化的.因此，定理1 
可以重新叙述如下. 

定理2 如果 L 在无穷远处是緩馒变化的，并且0彡 p < oo , 那么关系式 



w ( t ) ~ t~ p L (•) ， T - + 0 

(5.15) 

和 





(5.16) 

是等价的. 




定理2有辉煌的历史.结论 (5.16) - (5.15)(从测度到变换）被称为阿贝尔定理，其逆 
(5.15)-*(5.16)(从变换到测度）被称为陶伯定理.在普通的系统中，这两个定理是完全独立 
的，陶伯定理部分很难证明.哈代 ( G . H _ Hardy ) 和 J . E . 李特尔伍徳在其著名论文中用复杂 
的计算论述了 u »( A ) 〜 A " 的情形_ J . 卡拉马塔在1930年由于对这种特殊情形给出了一个 
简化证明而引起了-场 轰动. （这个证明仍可在复变函数和拉普拉斯变换的教科书中找到 .） 
不久以后他引入正则变化函数类并证明了定理2,但是他的证明对教科书来说是太复杂了. 
施密特 （ R . Schmidt ) 大约于1925年在处理同一问题时引入了缓慢变化的概念.我们的证明 
简化和统一了这个理论，并导致一个不出名但很有用的系. 

我们的证明的一个大优点是，当交换无穷远处和零点的作用时，即当 T — oo 
而 * — 0时，它仍然 适用. 这样我们得到了一个把 w 在无穷远处的性质和 U 在原 
点的性质联系起来的对偶 定理. 勝了推导 （6.2) 外，本书用不到这个定理 . 1 
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定理3 当原点和无穷远处的作用交換时，即当 t — oo ，* — 0 时，上述两个定理 
及其系仍然成立. 

定理2是本节的主要结果，但是为了完整起见，我们推导2个有用的补充定 
理.首先，当 f ； 有密度 P = u 时，我们希望得到关于《的估计.我们不能一般性 
地讨论这个问题.因为具有良好性质的分布 U 可以有性质极坏的密度队但在大多 
数应用中，密度 u 是 最终单 调的，即在某一区间 x 57 oo 上是单调的.对于这样的密 
度，我们有 

定理4①设 0< p < oo . 如果1/有最终单调的导教 u , 那么当 A —0, a ; — oo 时， 

uj ( X ) - j- p L Q ) 等价于 U ( aO 〜点广 1 ^ ⑻. (5.17) 

(关干一个表面上较强的形式，见习题 16.) 

证这个断言是定理2和下述引理的直接推论. 

引理饭设 y 有最终单调的密度 u . 如果 (5.16) 对 p > 0成立，那么 

u (*) ~ pU ( x )/ x , x -* oo . (5.18) 


[反之，即使《不是单调的， (5.18) 也蕴含 (5.16). 这已包含在带有 Z = «和 
p = 0的 8.9 节 (9.6) 中了 •]. 

证对于0 < a < 6， 

U ( tb )- U ( ta ) f b u ( ty)t 

— m~~L ~m Ay - (519) 

当 t — oo 时，左边趋于 W - 对于充分大的 t , 被积函数是单调的，于是 
(5.16) 蕴含当 t — oo 时被积函败是有界的.因此，根据 8.6 节的选择定理，存在这 
样的序列 t &，••• —00,使得当 < 跑遍这个序列时，在所有的连续点上有 


< ty)t 

m 


偏. 


(5.20) 


由此推出， 分在 0上的积分等于妒 - V ,从而 rl >{ y ) = pyP -\ 因为这个极限是 
与序列 {4} 无关的，所以关系式 (5.20) 对任意的逼近 t -» oo 都成立，并且对于 
» = 1,它化成 （5.18). ► 

例 （ c > 对一个特征函数为#的概率分布我们有【见 （2.7)1 

r e-^tl - F(a:)]cLE = [1- ¥>(A)]/A. (5.21) 

Jo 

①这包括 r 朗道 （E. Landau) 的著名的_伯定理.我们的 iE 明可以作为怎样利用选择定理拌除分析上 
的困难的新例_了-. 
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因为1 - F 是单调的，所以关系式 

1 - V ( A )~ A 1 — 叮 (1/ A ) 和 1 - F ( i )~ ^ xP ~ lL ( x ) (5-22) 

( p >0) 是等价的.下节将说明这个例子的用处. ► 

本定理的用处将在下节中举例 说明. 最后我们来说明怎样利用定理2导出一 
个关于幂级数的陶伯定理.[它曾被用于 12.8 节， (8.10) 中并将被用于 17.5 节中 •] 
定理5令如 > 0,饭设 x 

Q (8) = ' Z , QnS n (5.23) 

n =0 

对于0 < a < 1收效_如果 L 在无穷远处是缓慢变化的，且0彡 p < oo , 那么下列 
两个关系式 i ( 1 \ 

， 8 ^ l ~ (524) 

和 i 

9o + 9l + • • • + Qn-l ~ f(FTi) nPi(n)l n — 00 (5 . 25) 

是相互等价的 • 

更进一步，如果序列{<7„}是单调的，且 0< p < oo , 那么 (5.24) 等价于 

9 n 〜 ra -+ oo . (5.26) 

证设 f ； 是一个密度为 

U ( x ) = q n (5.27) 

(其中 n 彡 i < n + 1) 的 测度. (5.25) 的左边等于 U ( n ). U 的拉普拉斯变换 w 为 

w ( A ) = ( 528 ) 

于是可见关系式 （5.24) 和 (5.25) 分别等 价丁- (5.15) 和 (5.16). 因此，根据定理2,它 
们是相互等价的.类似地， (5.26) 是定理4的直接推论. ► 

例 （ d ) 设扣= n ^- 1 ^ n , 其中 p > 0, a 是任意的.序列{ 9 „}是最终单调的，因 
此 （5.24) 对 L ( t ) = r (/ j ) ln°t 成立. ► 

*13.6 稳定分布 

为了说明陶伯定理的用处，我们现在来推导集中于0^5上的最一般的稳定分 
布，并给出它的吸引范围的全部特征.与不集中于 W 上的分布所需要的方法相 
比，证明是非常简单明了的. 

•除了（6.2> 外，本节的结果巳在第9章并将在第17章独立地导出，稳定分布巳在 6.1 节中引进. 
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定理 1 对于固定的 0< a < l , 函數 i / a ( A ) = e _ A ° 是一个具有下列性质的分布 G a 的 
拉普拉斯 变换： 

G a 是稳定的，更确切地说，如果是有共同分布 G a 的独立变量，那 
么 （A +…+ X^/n 1 / 0 的分布也为 G a . 


a : a [ l - G a ( x )] 


T(l-aY 
e x _ ° G a ( x ) —»0, x -♦ 0. 


( 6 . 1 ) 


(6.2) 

证根据 13.4 节的准则 2, 函数〜是完全单调的，因为是完全单调的，有 
完全单调的导数.由于 «/ Q (0) = 1,所以拉普拉斯变换为％的测度 G a 的总质童为 
1. 因为所以所断言的稳定性是显然的. 

(6.1) 是 (5.22) 的一个特殊情形， (6.2) 是上节定理 3 和定理 1 的系的一个直接 
推论. ► 

定理2饭设 F 是一个集中于 W 上的概芈分布，使得（在连埃点上） 




(6-3) 


其中 G 是一个不集中于一点上的正常分布，那么 

( a ) 存在一个在无穷远处缓慢变化的*數 L ① 和满足0 < a < 1的常數 a , 使 

得 


1 - F(x). 


x~ a L(x) 

J w^r 


( b ) 反之，如果 F 具有 (6.4) 的形式，那么可以选取这样的知，使得 
nL{a„) 

K ' 


(6-4) 


(6.5) 


并且在这种情形下， (6.3) 对 G = G a 成立. 

这蕴含 (6.3) 中的可能的极限 G 与某个 G a 只是尺度因子有所不同.由此特别 
推出， 不存在其他的集中于 '0, oo 上的穗定分布 •（见 8.2 节中的引理 1. ) 

证如果 p 和 1/ 是 F 和 G 的拉普拉斯变换，那么 (6.3) 等价于 


- nln ^( A / on ) -» - lni /( A ). (6.6) 

根据 8.8 节的简单定理，这蛮含 - lnv > 在原点处是缓慢变化的，即 

- lnv >( A )~ A Q L ( l / A ), A -» 0, (6.7) 

①即 X •满足 (5.14). (6.4) 中的正规化因子 r ( l - a ) 是为了方便而引入的，它只彩嶢到 记号. 
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其中 L 在无穷远处缓慢变化，且 a 彡 0. 于是由 (6.6) 可得 - lni /( A ) = CX a . 因为 
G 不集中于一点上，所以我们有0 < a < 1. 

(6.7) 蕴含 

~ A Q - X L , A - 0. (6.8) 

由 （5.22) 知，关系式 （6.4) 和 (6.8) 是等价的.因此由 (6.1) 可推出 (6.4). 

对于逆部分，我们从 (6.4) 出发，刚才已证明 (6.4) 蓮含 (6.8). 对于固定的 n , 
把 an 定义为使 叫1 - F ( a :)] < l / r(l - <») 的: r 的下界.于是 (6.5) 成立.利用这点和 
L 的缓慢变化性，我们从 (0.4) 可知， 

1 - < p {\/ an ) ~ X a a - a L ( an / X ) ~ A a / n . (6.9) 

由此推出 (6.6) 的左边趋于 A a , 这就完成了 证明. ► 

(关于最大项的影响，见习题 26.) 

*13.7 无穷可分分布 

根据 6.3 节中的定义，为使一个拉普拉斯变换为 w 的概率分布 t / 是无穷可分 
的，当且仅当对于 n = l ， 2,…，正 ri 次根 u ；„ = 是一个概率分布的拉普拉斯 

变换. 

定理1 函数 w 是一个无穷可分分布的拉普拉斯变換，当且仅当 w = e 一穴 其中矽 
有完全单调的导数，且必 (0)=0. 

证利用 13.4 节的准则 2, 可见在 必(0) = 0 且 V 是完全单调时， w n = 是一 
个概率分布的拉普拉斯变换，因此条件是充分的. 

为了证明条件的必要性，假设对于每个 n , u n = e ~*/ n 是一个概率分布的拉普 
拉斯变换，令 

V ' n ( A ) = n[l - u >„( A )], (7.1) 

那么也„ —也而且导数< = - uu >' n 是完全单调的.根据中值定理 M ^) = 
A <( A ), 因为 — 也 所以这癟含序列 «( A )} 对于每个固定的 A > 0 
都是有界的.因此，可以选出一个收敛的子序列，根据广义连续性定理，其极限自 
然是完全单调的.因此，岭是一个完全单调函数的积分，这就完成了证明. ► 

这个定理的另外一种形式是 

定理2 函數 w 是一个无穷可分分布的拉普拉斯变换，当且仅当它具有 wse -* 
的形式，其中 

r °° 1 — 

m = i >{ dx }， （7.2) 

Jo x 

. 此节初读时可略去. 
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并且 P 是一个使得 

h x -^ ida ;} < oo (7.3) 

的測度. 

证由完全单调函数的表示定理，定理1的条件可以重新叙述为 | 我们必须有 
_ = 0,且 ^ 

^( A ) = jf °° e - A * P { £ Lc }, (7.4) 

其中尸是一个测度.在 a 点截断积分，把等号变为 >,这就逭含，对于每个 a > 0( 因 
为被积函数是有界的)， 

/ 0 l ~^ P { dx }. (7.5) 

Jo x 

由此推出 (7.2) 是有意义的，条件 (7.3) 是满足的.于是利用形式微分可以证明 (7.2) 
是 (7.4) 的积分，它在0点等于 0. ► 

【见习题17 〜 习题23和 13.9 节例 （ a ). 1 
例 （ a ) 复合泊松分布 

(7.6) 

的拉普拉斯变换为 e -^, (7.2) 对于 P{dx} = cxF{dx} 是正确的. 

例 （ b ) r 密度 x ^ e - z / T ⑷的拉普拉斯变换为 w ( A ) = l /( A + l ) a . 这里 
r°° I- e—k 

V >( A ) = a ^ — e~ x dx, (7.7) 

因为 V / ( A ) = a(A + l )- 1 = u /( A )/ w ( A ). 

例 （ c ) 穗定分布 .对 13.6 节的变换 a ; = e - A °, 我们有 训 A ) = ，且 
a r°° l — e -Ax 

Xa = f^)J 0 （ 7 . 8 ) 

正如利用微分法看到的那样. 

例 （ d ) 贝 塞尔* 数. 考虑 13.3 节例⑷中具有拉普拉斯变换 (3.10) 的密度 tv . 由 
(3.10) 的形式显然可见， tv 是 tv / n 与它本身的 n 重卷积，从而是无穷可分的.形 
式上的微分说明，在这种情形下， ^( A ) = r / V(A + 1) 2 -1, 并且容易证明（见习题 
6W 具有 （7.4) 的形式，其中 


P { dx } = re _ */ o ( i ) di . 
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例 （ e ) 从属性.由 13.4 节的准则容易看出，如果咖和咖是具有完全单调导数 
的正函数，那么复合函数妒 ( A ) = MMXY ) 也是具有完全单调导数的正函数.对应 
的无穷可分分布特别重要.为了求出它，用表示拉普拉斯变换为(其中 
j = 1,2) 的概率分布，并令 

U t ( x ) = J ^° { da }. (7.9) 

(于是分布 l / t 是通过把 Qi 2) 中的参数《随机化而得到的 . 的拉普拉斯变换为 

0 =f = e - 时 (A >. (7.10) 

Jo 

读过 10.7 节的读者可看出 (7.9) 中过程的从厲关系 I R 通过指导过程从 
属于由此我们可以看到，我们多么容易地求出了新过程的拉普拉斯变换，虽 
然我们只对分布是集中于正半轴上这一特殊情形进行了讨论. 

有一种特殊的情形值得注意：如果 V - i ( A ) = A Q ,^( A ) = A ^, 那么 t ^( A ) = 
因此，一个由稳定的过程指导的稳定 a 过程可导致一个稳定的过程.读者应 
当验证，这个结论在本质上重复了习题10的断言.关于更一般的命题，见例 6.2 节 
( h ). 

例 （ f ) 指数分布的每一种汛合都是无穷可分的 ®. 这种混合的最一般的分布具有 
如下形式的 密度： ① 

/0«0= (7.11) 

Jo 

其中 I ；是一个概率分布.在 13.3 节例 （ f ) 中巳经证明：当17集中于有限个点 
0 < ai < • • • < a „ 上时，拉普拉斯变换具有形式 






入 + 6 n -i 1 

X + 0„_1 A + 0 „' 


其中 a * < 6 fc < a *+ i . 由于 


d . A + 6fc 1 1 

dA lD AT^ = AT^ _ AT^ 

bk-Qk 

(A + aj；)(A + bit) 


(7.12) 


(7-13) 


是两个完全单调函数的乘积，所以它本身也是完全单调的.由此推出 (7.12) 中毎个 
因子都是无穷可分的，因此 P 也是无穷可分的•对于一般的混合，本断言可通过简 
单的取极限推出（见习题20~习题 23). ► 

①这个出人意料的结果应归功于 F . W . Steutel , Ann . Math . Statist ., vol . 40(1969) pp . 1130— 
1131 和 vol . 38(1967) pp . 1303—1305. 
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*13.8 高维情形 

向高维的推广是显 然的： 如果把： T 解释为列矩阵（町…，〜)，把 A 解释为行 
矩阵（乂…, A „), 那么甚至连定义也不需要改变.于是 


Ax = Ajll + ••• + A n x n 

是 A 和 a : 的内积.在概率论中多维变换的用处是有限的. 

例 （ a ) 预解方租.设/是一个具有普通拉普拉斯变换 p ( A ) 的一维连续函数.考 
虑两个变量 s ， t 的函数 f(s + t ). 它的二维变换为 

w(A,i/) = 乂 °° 乂 °° + t)d»dt. (8.1) 

经过变量替换 s + t = * 和 - s + t = j /后，这个积分化为 

^ J\-^ x+ ^ x f(x)dx J X 

= rbi° 0(e ~ ,/x_e ' Al)/(a:)da: - 


于是 


w ( A , i /)= — 


< pW - 

\ — v 


( 8 . 2 ) 


我们将在更一般的背景下再次遇到这个关系式，那时它将作为半群基本预解方程 


出现[见 （10.5) 和 13.10 节最后的说明]. 

例 （ b ) 米塔列夫勒 （ Mittag - Leffler ) 函数. 本例说明可把高维变换作为计算简 
单变换的工具.我们将证明下列命超. 

如果 F 是铯定的，且它的拉普拉斯变換为 e - A ' 那么分布 

G t ( x ) = 1 - F ( t / x ^ a ), x >0 (8.3) 


( t 是固定的）的拉普拉斯变換为米塔-列夫勒*數 


V 2, (_ 入) fc t ka 

toWTka ) - 


(8.4) 


这个结果是相当重要的，因为在许多极限定理中 G 和 F —道出现[例如，见 
11.5 节（5.6)】.直接的计算似乎是很困难的，但是按照下述方式进行将是很容易的. 


* 此节初读时可略去. 
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首先固定 a :, 取 t 为变量. G t ( x ) 的普通拉普拉斯变换 7 t (岣(其中^是变量）显然是 
(1- 〆 ■*)/«/•除了正规化因子!/外，这是一个以 a ： 为变量的分布函数，它的拉普 
拉斯变换显然是 


这是 (8.3) 的二元 变换. 在理论上这可通过先取关于 a : 的变换，后取关于 t 的变换 
而算出，从而 (8.5) 是我们要求的变换关于 f 的变换.但是把 (8.5) 展开成几何级 
数，我们可看出实际上 （8.5) 是 (8.4) 的变换，从而这个命题得证. 

米塔-列夫勒函数 (8.4) 是指数函数的推广，当 cr = 1时它就化为指数函数 .► 

13.9 半群的拉普拉斯变换 

拉普拉斯积分的概念可以推广到抽象值函数和积分,*但是我们只考虑与马尔 
可夫过程有关的变换半群的拉普拉斯变换 .® 我们仍用 10.8 节中的约定和记号. 

设 Z 是一个空间 （例如 直线、区间或全体整数)， if 是由2：上的有界函数组成 
的一个巴拿赫空间，其范数为 | N | = sup | u ( x )|. 我们假设，如果有 ue _ Sf ， 那么也 
有 M e 义设> 0} 是幺上的一个连续收缩半群.换句话说，我们假设 
对于 uejf 存在一个函数 Q ( t)tx e 兄而且 Q ⑷具有下列 性质： 0彡《彡1後含 
0( t)u < l ; Q(t + a ) = Q ( f)Q ⑷; a (/0 — Q ⑼ = 1， 1 是恒等算子 .® 

我们从定义积分开始.给定上的任一概率分布 F , 我们想要定义一个从 
■^到 if 的收缩算子£,将它表示为 

E = /°° Q ( s ) F { d a }, (9.1) 

Jo 

使得 oo 

Q ( t)E = EQ ( t ) = f Q(t + a ) F { ds }. (9.2) 

Jo 

(要记住五对分布 F 的依赖性 .） 

对于与转移概率为 Q t ( x , n 的马尔可夫过程有关的半群，这个算子五可由下 
列随机核或次随机核导出> 

rQ .( x , r ) F { d 8}. (9.3) 

Jo 

① S. Bochner 在 Completely monotone functions in partially ordered «pace« (见 Duke Math. 
J., vol. 9(1942)519-526) 一文中发展了一括形如 (9.6) 的变换的窗有成果的 理论. 关于向任 
意算子族的推广，见 E. Hille 和 It S. PhilUpe 合著的书 (1957). 

® 14.7 节中的最小解的构造可以作为本方法的典型例子. 

③囬忆 10.8 节，自同态的强收敛 T „ — T , 就是对于所有的 u €^ f , || T„u - T „||-0. 我们的•连 
续•是•在 t 多0上强 连续- 的*写语. 
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如果 F 是原子型分布，那么可以给算子 B 下一个很自然的（几乎是微不足道 
的)定义，简单的取极限手续就可导致我们想要得到的下列定义. 

设巧 > 0且 Pl + • • • + fV = 1. 线性组合 

E = PlQ(tl) + •••+ PrQ(tr) (9.4) 

仍是一个收缩算子，可以看作是 Q ⑴关于对6賦予质量巧的概率分布的期望.这 
对有限离散分布的特殊情形定义了 (9.1), 并且 (9.2) 是正确的.一般的期望 (9.1) 可 
像黎曼积分那样通过取极限来定义：把0755分成区间 h ,- -, In , 选取~ e 心，所 
构成的黎曼和 EQ ⑹巧/*}是一个收缩 算子由 10.8 节 (8.7) —致连续性看出，熟 
悉的收敛性证明仍然有效.这把 (9.1) 定义为波赫纳积分的一个特殊情形. 

如果半群由推移算子组成，即对于所有的 = 那么£1 = 1. 对于£?， 
我们将利用记号 (9.1), 对于函数我们将利用通常的符号 

Ew = J Q ( 8 )w - F { da } (9.5) 

(虽然从逻辑上讲把 m 写在积分外更一 致). Ew ( x ) 在给定点 a : 上的值是数值函数 
£1(«)«»(1)关于 F 的普通期望 • 

在 F { da ] = e - A » da 的特殊情形，箅子£；称为半群的拉普拉斯积分或預解算 
子.它将被表示为 ^ 

«( A ) = J e ~ x , Q { s ) d9 , \> 0 . (9.6) 

由 （9.2) 看出，预解算子 «( A ) 和半群中的算子 Q ⑴是交换的.为使 A 5 R ( A )1 = 1, 
当且仅当对于所有的= 1,因此为使收缩算子 A «( A ) 是推移算子，当且仅 
当所有的 Q ( s ) 都是推移算子. 

弓 I 理如果我们知道了 SR ( A ) u ; 对于所有的 A >0 和的值，那么我们就唯 
一地确定了半群. 

证在给定点：<：上的值 


9{( 入 )w(x) = f e~ M Q(t)w(x)dt 

Jo 

是由 Q ⑴ w ( t ) 所定义的 t 的数值函数的普通拉普拉斯变换.因为这个函数是连续 
的，所以它被它的拉普拉斯变换唯一确定（见 13.1 节的系).因此，对于所有的 t 和 
所有的是唯一确 定的. > 

拉普拉斯变换 (9.6) 可导致关于半群无穷小生成元 U 的特征的一个简单描述. 
根据 10.10 节中这个算子的定义，我们有 
Q(h) - 1 
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只要 Uu 存在（即只要两边之差的范数趋于 0). 
定理1 对于固定的 A >0, 为使 


当且仅当 U 在11的定义城中且 

u = 5R(A)t«, 

(9.8) 


Atx — Uu = w. 

(9.9) 

证⑴用 (9.8) 定义利用期望的性质 (9.2), 我们可得 


二 1 -u =i /°° e- A, Q(a + ^ 厂 e~ Xt Q(a)wd8. 

"■ « Jo Jo 

(9.10) 

在第1个积分中引入变贵替换 

a + h = t 使上式化成 


£!(/»)-1. e Ah - 1 

厂 e- At Q(t)uidt -\J k e^-^Qi^wdt 


h U h 


_ e M _ 1 
= ~ h ~ 

(u — A -I w) - \ f e A ( fc _*)(Q ⑴ tu - w)dt. 

<* Jo 

(9-11) 


因为当 f 0时， || Q ⑴ - HI — 0,所以右边第2项依范数趋于0,从而整个右边 
趋于 A(u - X ^ w ). 因此 (9.9) 是正确的. 

( U ) 反之，假设 llu 存在，即 (9.7) 蚊. 因为 A «( A ) 是一个与半群可交换的收 
缩算子，所以 (9.7) 蕴含 

1_ l gl ( A)u - W ( A ) iIu . (9.12) 

但是我们刚才看到左边趋于 A «( A ) u - u , 结果所得的恒等式把 u 表示为 （9.9) 中函 
数 w 的拉普拉斯变换. ► 

系1 对于给定的幺， （9.9) 存在唯一的一个解 u . 

系2 两个不同的半群不可能有相同的生成元 U . 

证当知道生成元 IX 时，我们可以对所有的 wesf 求出拉普拉斯变换 W ( A )«;. 根 
据上一引理，这就唯一地确定了这个半群的所有算子. ► 

人们可能很想推导类似于 13.5 节中诸定理的陶伯定理，但是我们将满足于下 


面相当基本的 
定理 2 当 A — c 

»时， 



A9l(A) — 1. 

(9.13) 

证对于任意的: 

weSf , 我们有 



||A9l(A)ti; - «»|| < r ||Q ⑴ u> - . Ae- At df. . 

(9.14) 
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当 A 00时，密度为 Ae ~ At 的概率分布趋于集中在原点上的分布.被积函数是有 
界的，且当 * — 0时趋于0, 从而积 分趋于0, (9.13) 成立. ► 

系3 生成元 U 的定义域在中稠密 • 

证由 (9.13) 推出，每个 w e Y 都是一个由形如 A < R ( A )«; 的元素组成的序列的强 
极限.根据定理1,这些元素都在 U 的定义域中. ► 

例 （ a ) 无穷可分半群 .设是具有 (7.2) 所述的拉普拉斯变换 w = 的无穷可 
分分布. 

拉普拉斯变换为 

乂°° = e -^ (A) = exp (-t 乂 °° ■二 : (9.15) 

的分布 l / t 也是无穷可分的，有关的卷积算子 U ⑴构成一个半群.为了求出它的生 
成元 ®, 选取一个有界连续可微函数那么，显然有 

迎戸咖卜厂 • i yUt{dy} . (9.16) 

1 Jo v 1 

对 (9.15) 取微分可证明测度 t ^ yUddy } 的变换为 ^( A ) e -^^>. 当 t — 0时， 
^( A ) e -^ W 趋于 作). 但是少是测度 P 的变换，从而我们的测度趋于 R 因为 
上式积分号下的分式（对于固定的 a ：) 是 y 的有界连续函数，所以我们得到 

iXv{x) = (9.17) 

Jo y 

这样我们的无穷可分分布的典型表示给出了测度 p 的一种解释. 

例 （ b ) 从属半群.设 m )) 表示一个任意的马尔可夫半群，设 r 是上例中的无 
穷可分 分布. 正如 10.7 节所说明的那样，可以通过把参数 t 随机化而得到一个新的 
马尔可夫半群.用现在的记号有 



= / Q ( a )^,{ ds }. 

J 0 

(9.18) 

为了简单起见，令 


V ( s , x ) = ~ - v ( x ), 

(9.19) 

我们有 


^ ，( * } ~、 ㈤ =厂 V ( s , x )- ^ U t { da }. 

(9.20) 


①这个推导是为了举例说明而给出的.这个生成元早在第9章中巳经知道了，可以通过复合泊松分布 


取极限而得到. 
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对于 U 的定义域中的一个函数《和一个固定的 A 函数 V 是处处连续的(包括原点)， 
因为当《 - 0时 V ( a , x )~* iXw ( x ). 我们在上例中已看到，当 * — 0时, t ^ sUtids } -» 
P { d *}. 于是 (9.20) 的左边趋于一个极限，从而存在并且为 

U * w ( ar ) = V (8, x ) P { ds }. (9.21) 

Jo 

结论是 ， U 的定义域和 U •的定义域是一致的， 并且在 (9.21) 对于 U 的定义域中的 w 
成立的意义上有 ^ 

U * = [°° Q ^~ 1 P { d 8 }. (9.22) ► 

Jo 8 

13.10 希尔-吉田定理 


著名的极其有用的希尔-吉田定理刻划了任意变换半群的生成元的特征，但 
是我们将只对收缩算子半群讨论此定理.定理断言，上节中得到的生成元的性质不 
仅是必要条件，而且也是充分条件. 

定理 1 (希尔-吉田 ( HUle - yosida )) 为使一个定义城为 Sf ' cSf 的算子 U 是一个 
由 Jif 上的收缩算子 Q ⑴ (其中 Q ⑼= 1) 构成的连读半群的生成元，当且仅当它具 
有下列 性质： 

⑴对于每一个 e if , 方租 

Au — Uu = w , A > 0 (10.1) 

恰有一个解 u ; 

( ii ) 如果 0 <10^ 1, 那么 0 < Ati ^ 1； 

( iii ) il 的定义城在幺中是稠密的. 

我们已经知道，每个生成元都具有这些性质，从而条件是必要的.此外，如果 
把解 U 表示为 U = n ( A ) w , 那么我们就可知道 «( A ) 与拉普拉斯变换 (9.6) -致，因 
此可以把定理的条件改述如下. 

( iO 算子 ! H ( A ) 满足恒等式 


A ! R ( A )- UfR ( A ) = l . (10.2) 

«( A ) 的定义域是幺，值域与 ii 的定义域幺'一致. 

( ii ') 算子 A £«( A ) 是一个收缩算子. 

( iii ') «( A ) 的值域在幺中是稠密的. 

我们从 12.9 节定理2知道， fR ( A ) —定满足另一个条件 

A 9 l ( A ) — 1， A -» oo . (10.3) 
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这蕴含毎个 u 是它自己的变换的极限，从而 9 t ( A ) 的值域义'是稠密的.由此 
推出可用 （10.3) 代替 ( iiiO , 于是定理的3个条件完全等价于条件组 ( i ')、（ U ')、(10.3). 

现在假设已给出一个具有这些性质的算子族 «( A ), 我们着手把所要求的半群 
构造为一族伪泊松半群的极限.构造依赖于 
引理1 如果 U ) 属于 il 的定义城 if ', 那么 

im{X)w =^{{X)U.w. (10.4) 

算子和汛»是可交换的且满足預解方程 

91( A )- W ( i /) = { y - A )9 l ( A )9 l ( v ). (10.5) 

证设《 = ilu •因为 u 和 u ; 都属于 U 的定义域义，所以由 (10.1) 推出 u 也属于 
U 的定义域并且 

Av — tlu = liw. 

于是 w = W ( A ) Uti ;, 此式与 (10.4) 相同 • 

其次，把2定义为 lb = «;的唯 一解. 从 （10.1) 中减去 a 经过简单的重 
新排列后我们得到 

入 (u z ) — U(u — z ) = ( i / — A ) z , 

此式和 (10.5) 相同. 这个恒等式的对称性蕴含算子是可交换的. ► 

为了构造我们的半群，我们回忆一下 10.9 节 的定理 1 , 对于任一收缩箅子 ； T 
和 a >0, 存在一个相应的收缩算子半群 


e « t ( T - i ) = e o. (10.6) 

这个半群的生成元是 a(r - 1), 它是一个自同态. 

我们把这个结果应用于 r = A5H(A). 为了简单起见，令 

iX x = A[A9l(A) - 1] = AilW(A), QA(i) = e m> - (10.7) 

这些对 A > 0 定义的算子是彼此可交 换的. 对于固定的 A , 算子 U A 产生一个由收 
缩算子 Qa ⑷构成的拟泊松半群. 

由 (10.4) 推出，对于给定的算子 U 的定义域 if' 中的所有的 u, 我 

们可以忽略 iU 的特殊定义，而把希尔-吉田定理的其余断言看作一个有用的更一 
般的极限定理的特殊 情形. 其中 A 可以限制于整数序列. 

通近引理 2 设 { Qx ( t )} 是一族彼此可交换的由自同态 1 X A 产生的伪泊松 半群. 
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如果对于一般稠密集合中的所有的 u ， lUu 4 iUi , 那么 

QaW — Q ( t ), t -* oo , (10.8) 

其中是一个收缩算子半群，吋于所有的 ue _ Sf ', 它的生成元与 il 一致 • 

此外，对于 ue _ Sf , 


||Q ⑴ u - Q a (<)«II < t||Uti - U A u ||. 

证对于两个可交换的收缩算子，我们有 

S n - T n = ( S ' 1 - 1 + ••• + T '-^ iS - T ), 


从而 

|| S"u - r ' ull ^ n\\Su - Tu || 

把这个不等式应用于算子 Qx { t / n ), 经过明显的重新排列后得到 


||。鄭- Q “ t ) u || < 

_ Qu ( t / n ) 


\ Ox ( t / n)-l 

t/n 


t/n 


~ U |- 


令 n - 


, 我们得到 


||Qa(0« - Q« / ⑷ u|| < <||Ua« - 


(10.9) 


( 10 . 10 ) 


( 10 . 11 ) 


( 10 . 12 ) 


这说明对于 u e 当 A — oo 时序列 {£ I A ( t ) u } 是一致收敛的.因为 y 在幺中 
是稠密的，所以这个一致收敛可以扩展到所有的如果我们用 Q ( t )« 表示这个极 
限，那么我们就得到一个使 （10.8) 成立的收缩算子 Q ( t ). 半群性是显然的.同样， 
在 (10.2) 中令 - oo , 我们得到 （10.9) .像 (10.11) 那样改写左边可得 

||^^«- — Hxn \\. (10.13) 

取 A 充分大，使右边< «. 对于充分小的 t , 左边第2个差商与 U A u 之差的范数小 
于 e , 从而它与 Uu 之差的范数小于 3«. 因此，对于 U e JJf ' , 

Q (*) 厂 1 u — ! lu , (10.14) 


这就完成了证明. 
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例扩散.设义是直线上所有在 ± oo 处趋于零的连续函数所构成的函数族.为了 
利用通常的记号，我们把 A 换为 ft - 2 , 并令 fc — 0. 把差分算子 V h 定义为 

= (10.15) 

此式具有 / i - 2 ( r - i ) 的形式，其中 r 是一个推移算子，从而产生一个由推移 
算子组成的半群 e 〜-( 它是一个马尔可夫半群).算子 V h 彼此可交换，对于一、二、 
三阶导数都有界的函数，一致地有 — \ u ". 引理2蕴含存在这样一个由算子 
U 产生的极限半群 {£!(*)}. 使得至少在《充分光滑的时候 ， Qu = \ u ". 

在这个特殊情形下，我们知道 { Q ( t )} 是方差为 t 的正态分布的卷积半群，我 
们并没有得到新的 结果. 但这个例子还是揭示了（有时）可以多么容易地证明具有 
给定生成元的半群的存 在性. 例如，这个论证可应用于更一般的微分算子，也可应 
用于边界条件.（见习题24和习题25_ ) ► 

关于预解式和完全单调性的注 希尔-吉田定理强调生成元 U 的性质，但是可以这样重 
新叙述这个定理，以便得到族 {«( A )} 的特征描述. 

定理 2 (希 尔- 吉田定《的另一种形式 • ） 自同态族 {91( A ) : A > 0} 是一 个收垴 算子半 
鮮 { Q ( t )} 的預解式，当且 仅当⑷ 满足預解才* 

91( A ) - « R (^) = (^ - A )5 R ( A )! R (^), (10.16) 

( b ) AW ( A ) 是一 个收绾 舁子， （ c ) 当 A - m » 时， A «( A ) -f 1. 

证 （10.16) 与 (10.5) 相同，而条件 （ b ) 和 （c ) 与（纪）和 (10.3) 相同.因而这3个条件都 
是必要的. 

假设条件成立，我们定义一个算子 U 如下. 选取某个1/ > 0,把定义为 《(«/) 的值 
域，也就是说，为使 tt €幺、当且仅当存在 w e 义，使得 u = 对于这样的 ii , 我 

们令 Uu = \ u - w . 这就确定了一个定义域为 f 且满足怛等式 


««(«/)- U ! R («/) = 1 

(10.17) 

的算子 u . 我们来证明这个恒等式可以推广到所有的 a , 即 


A 9 t ( A )- U « R ( A ) = l . 

(10.18) 

左边可以改写成下面的形式 


( A -«/)9 l ( A )-(»/- ll )«( A ). 

(10.19) 

利用 （10.16) 和 （ t / - il )« ⑻ =1这个事实，我们得到 


(«/- il ) W ( A ) = l + ( i /- A ) W ( A ). 

(10.20) 
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利用 (10.19) 可推出恒等式 (10.18). 这说明，希尔-吉田定理的所有条件都满足，这就完成 
了证明. ► 

本定理说明整个半群理论依赖于预解方程 (10.16), 因此用函数的普通拉普拉斯来说明 
它的意义将是很有 趣的由 (10.16) 显然可见，在1/ — A 时 《(«/) — M(A) 的意义上， «H(A) 
连续依赖于 A. 但是我们可以再深入一步，用 

«’( 入 ）= Um = -Sn 2 (A) (10.21) 

定义一个导数 《'(A). 同样的手续说明右边的导数为 _2SH(A)W(A). 利用归纳法可见 W(A) 
有各阶导数并且 

(-l) n W (n) (A) = n!9l n+, (A). (10.22) 

现在设 u 是义中的任一函数，使得0 < U < 1. 选取一 "t 任意的点： r 并令 u»(A) = 
«(A)«(a:). (10.22) 的右边是一个范数< nl/A B+, 的正算子，从而 w 是完全单调的，且 
|w (n) (A)| < n!A B+, . 于是由 13.4 节中的系推出 u; 是一个普通的拉普拉斯变换，它的值位 
于0和1 之间. 如果我们用 Q(tM*) 表示这个函数，那么就把 Q ⑷定义成了一个收缩算 
子.把预解方程 （10.16) 和 (8.2) 进行比较，可以看出它邃含半群性 


Q(t + «)u(z) = £}(t)Q(d)u(z). (10.23) 

因此我们看出，只利用普通函数的经典拉普拉斯变换就可从 (10.16) 导出半群理论的 
主要特征.特別地.预解方程只不过是 13.8 节例 （a) 的一 种抽象形式而巳. 

为了进一步强调现在的抽象理论只解释了关于普通拉普拉斯变换的定理的意义，我们 
来证明一个反滇公式. 

定理3 对于固定的 f >0, 当 A — oo 时 

- Q ⑴. (10.24) 

证由 W(A) 的定义 （9.6)( 此式把 91(A) 定义为 0(0 的拉普拉斯变换）可推出 

(-l)"» (n >(A) = jf°° e- A, s n Q(«)da. (10.25) 

(10.24) 的左边是 Q(a) 关于密度 nle -^ na / tr^/tin - 1)!] 的积分，此密度的期望为 t, 
方差为 t 3 / n . 当 n 90时，这个测度趋于集中在 t 上的分布•由 Q ⑷的连续性，这《含 

(10.24) , 正如函数的情形那样[公式 （10.24) 和 7.1 节式 (1.6) 相同 !• 


13.11 习 题 

1 .设 F, 是一个对点 nq{n = 0,1,…） 賦予质置职" 的几何分布.证 明：当 g — 0时， F, 
趋于指数分布 1-e-*, 且它的拉普拉斯变换趋于 1/(A + 1). 



2 •证明， cos* 和 sinx 的普通拉普拉斯变换为 A/(A 2 + 1) 和 1/( 入 2 + 1), 以及 （1 + 
a- 2 )e-"(l-co8aa:) 是一^拉普拉斯变换为 (1+ « 3 )(A +1)-*^+1) 3 +B 2 ]- 1 的概率 
密度. 提示， 利用 e ta = co Sa ： + i sinx 或连续两次使用分部积分公式. 

3. 设 w 是-个测度 t； 的变换，那么 a; 在和 W 上可积，当且仅当 1/J： 分别在 
和 M 上关于 U 可积. 

4. 帕塞瓦尔 (Parseval) 关系式•如果； f 和 F 是独立随机变量，分布分别为 F 和 G, 变 
换分别为 V> 和7,那么 AT 的变换是 


乂 V >( Ay ) G { d »} = ^ 7(^ y ) F { d »}. 


5.设 F 是一个变换为的分布.如果 a > 0;那么 V (A+a)/v>(a) 是分布 e-°»F{d*}/v>(a) 
的变换.对于固的 t > 0,用 13.3 节例 （b) 证明 ® I 



是•个密度为 

的无穷可分分布的变换. 

6.用 2.7 节 (7.1) 定义证明^对于 A > 1,1 0 (*)的蒈通拉普拉斯变换是 4(A) = 1/v/F^T. 

[議 等式切 

7•读. 证明在 = /i, 从而 A 的普通拉普拉斯变换为 u»i(A) =吻 (A)fl(A), 其中 R ( X ) = 
X - y / X ^ l . 

8. 续.证明：对于 n= 1,2,…，2/； = /+ 从而根据归纳法， J„ 的普通拉普拉 
斯变换为 a;„(A)=wo(A)fl n (A). 

9. 由 13.3 节例 （e) 通过积分证明 ■ e l/x - 1是 I 八1掏 y / i 的普遢拉普拉斯变換. 

10. 设X和/分别是拉普拉斯变换为和 6-*° 的独立随机变最，则 XY ” a 的拉普拉 
斯变换为 V(A°). 

11. 一个概率分布的密度/是完全单调的，当且仅当它是指数密度的混合[即它具有 (7.11) 
的形式 j. 提示， 利用习题 3. 

12•在 p(A) = 1/(A+1) 和 V (A) = e- x 的特殊情形下直接利用计算来验证反演公式 （4.5). 

13. 证明： 当把/和 p (n) 换为它们的绝对值时， 13.4 节中的系仍然成立 • 

14. 假设 e-*/„(*) 在无穷远处是单调的，利用习題8证明 

~①这个公式出现在应用中,己多次被导出过（所利用的都是冗长的计算). 
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15- 假设当 A — 0时1 - ~ 其中 p > 0. 利用 13.5 节例 （ c ) 来证明< 当 

* 00 时，1 - F n *{ x ) ~ nx ^ Ul / y / x )/^). 【试把这个结论和 8.8 节例 （ c ) 加以比 

较 .] 

16. 在 13.5 节定理4中只需 «(*)- «(*), 其中 v 是最终单调的. 

17. 每个无穷可分分布都是复合泊松分布的极限. 

18. 如果在无穷可分分布的典型表达式 （7.2) 中，当 a : — 00 时， P ⑻〜 x c L(x ), 其中 
0 < c < 1, 证明， 1 - F (*)~ ( c /1- c)x e ~ l L(x). [ft 17.4 节例⑷中继续讨论 .j 

19. 设 P 是一个无穷可分整值随机变量的母函数，是一个概率分布的拉普拉斯变换.证 
明， P ( v ) 是无穷可分的. 

20. 无穷可分的拉普拉斯变换收敛于一个概率分布的拉普拉斯变换 A 当且仅当典型 
表达式 (7.2) 中的相应测度收敛于 . 因此，无穷可分分布序列的极限本身也是 
无穷可分的. 

21. 设 F „ 是相应于混合分布1/„的诸指数分布的混合 (7.11). 序列 { F „} 收敛于一个概率 
分布/当且 仅当队 收敛于一个概率分布 t /. 在这种情形下， F 是相应于 C 7 的混合. 

22. 密度为完全单调的概率分布是无穷可 分的. 提示：利用习题11、习題21和 13.7 节例 
( 0 - 

23. 几何分布的任一混合都是无穷可分的.提示《仿照 W .7 节例 （ f ). 

24. 具有一个吸收壁的护散.在 13.10 节的例中把 z 限制于 i >0,并且当 a : - h < 0时 
在 • 的定义中令 -h) = 0. 证明 I 如果幺是所有满足 u ( oo ) = 0, ti (0) = 0的连 
续函败所构成的空间，那么收敛性证明仍有效，但如果把最后一个条件去掉就不行了. 
结果所得到的半群曾在 10.5 节例 （ b ) 中给出过. 

25. 反射壁.在 13.10 节的例中把 a : 限制于 * > 0,并且当 a : - h < 0时在 V h 的定义中 
令 《(* -h) = u(x + h). 那么对于毎一个一、二，三阶导数都有畀且满足《'⑼= 0的 
u . Vftti 都收敛.这个边界条件限制了 U 的定义域结果所得到的半群曾在 10.5 节 
例 （ e ) 中给出过. 

26. 最大项在向 ft 定分布的收敛中的 影响.设而，於 ，…是独立变量，具有满足 （6.4) 的 
共间分布即具有屑于租定分布 G 。 的吸弓 | 域的共同分布 F . 令 S „ =不+…+ 
X „, M „= max [ A -,, - ) X „]. 证明，比 5„/ M „ 的拉普拉斯变换 «„( A ) 收敛于 35 

- 71 -^ - . (*) 

1 +a / ( l - y ) t a -* d £ 


从而 E(S„/M n )-*l/(l-a). 

提示 • 在区域& < 上计算积分，我们得到 

«»(A) = 册一乂 °° ^{dx} (乂°° e _ All/ *F{d»}) " _1 • 

® 达林 （D. A. Darling) 利用特征函数推导了这个结果和关于指败为 a > 0的稳定分布的类似结果. 
见 TVans. Amer. Math. Soc., vol.73(1962)pp. 95-107. 
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代入 y = fcr , 然后代入 x = o „ s , 其中 o „ 满足 (6.5). 易见内层的积分为 

H /: (一端-⑴ 
…手。⑴， 

其中少 ( A ) 是 （*) 中的分母.因此 

Wn(A 卜 e_> jf . 宗=，• 
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本章可以作为第13章的课外读物.它包括几个相互独立的课题，这些课题包 
括一些实际问题 （14.1 节、 14.2 节、 14.4 节和 14.5 节）以及 14.7 节的一般存在性定 
理 .14.3 节的极限定理说明了讨论正则变化时所述的方法的威力.最后一节描述在 
讨论马尔可夫过程的渐近性质和首次通过时间时需要用到的技巧. 

14.1 更新 方程： 理论 

关于概率背彔，读者可参考 6.6 节和 6.7 节.虽然第11章致力于更新理论，但 
我们这里要给出的是一个简单的独立的方法，把这里的方法、结果与第11章的方 
法、结果进行比较将是很有趣的.给出拉普拉斯变换的基本理论后，现在的方法更 
简单更直接，但是基本更新定理的精确结果现在还无法用拉普拉斯变换得到.另一 
方面，利用拉普拉斯变换更容易导出 14.3 节的极限定理和 14.2 节讨论的那种类型 
的显式解. 

现在研究的对象是积分方程 

V (*) = G ( t ) + j^V(*-:c)F{dr }， (1.1) 

其中 F 和 G 是给定的单调右连续函数.当 t < 0时，它们等于 0. 我们把它们看成 
是测度的非正常分布函数，假设 F 不集中在原点上，且它们的拉普拉斯变换 

< p (\) = 7( A ) = J o °° e - Xt G { dt } (1.2) 

对任意的 A > 0是存 在的. 和在上一章中一样，取所有的积分区间为闭的.我们将 
证明恰好存在一个解 R 它是一个非正常分布函数，它的拉普拉斯变换0对所有 
的入 > 0都存在.如果 G 有密度 g , 那么 V 的密度1；满足通过取 （1.1) 的微分得到 
的积分方程 t 

v ( t ) = g ( t ) + f v { t - i ) F { dx }. (1.3) 

Jo 

回忆卷积法则，我们得到，对于分布 V 的拉普拉斯变换利或它的密度的普通 
拉普拉斯变换） 有哝” +物 ,从而在形式上有 
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为了证明这个形式上的解是一个测度（或密度）的拉普拉斯变换，我们分3种情形 
(其中只有前两种情形在概率上是重要的）进行讨论. 

情形 （ a ). F 是一个不集中于原点上的板芈分布.那么 y »(0) = 1，且对于 A > 
0， v »( A )< l .因此， 

w = I ^ = f> n (!-5) 

丫 0 

对入 > 0收敛.显然， u ; 是完全单调的，从而是一个测度 J 7 的拉普拉斯变换 (13.4 
节的定理 1). 于是矽= o ; 7 是卷积 V = U - kG 的拉普拉斯变换，即 

V { t )= f G ( t - x)U { Ax } (1.6) 

Jo 

的拉普拉斯 变换. 最后，如果 G 有密度 g , 那么 V 具有密度 t ; = Uirg . 于是我们证 
明了上述积分方程的解的存在性和唯一性. 

13.4 节的陶伯定理 2 描述了 V 在无穷远处的渐近 性质. 考虑 G ( oo ) < oo 且 F 
有有限期望 P 这样一个典型 情形. 在原点附近 V >( A )~ m -' GMA - 1 , 此式蕴含 

V ( i )~/ i -1 G ( oo ) t , t -^ oo . (1.7) 

利用 11.1 节中的更新定理可得到更梢确的结果， 

V(t + h )~ V ( t )~* m _1 G ( oo )/ i ， 

但这无法由陶伯定理 导出. [当 F 的期望不存在时，陶伯定理可导出更好的结果（见 
14.3 节) .] 

情形 （ b ) . 是一个亏损分布， ^( oo ) < 1. 为简单起见，也假设 G ( oo ) < 00 .上 
面的论证仍然有效，只不过是现在 ¥>(0) = F ( oo ) < 1,从而 w ⑼ < ooi 测度 K 是 
有界的. 

情形 （ c ). 最后一种 情形是 F ( oo ) > 1. 对于的较小的值， (1.4) 中的分母是负 
的； 对于这样的值， w ( A ) 不可能是一个拉普拉斯 变换. 幸好这个事实并不引起麻烦. 
为了避免微不足道的情形，假设尸在原点上没有原子，从而当久4 00时^(久)-0. 
在这种情形下，方程 vKfc ) = 1存在唯一的一个根 fc > 0 •情形 （ a ) 下的论证对 A >* 
仍然 适用. 换句话说，存在唯一的一个解但是它的拉普拉斯变换 w 仅对 A > * 
收敛. 对于这样的值， u ; 仍由 (1.4) 给出.① 

①解V具有形式 V { dx } = 其中 V# 是把标准更新方程 （1.1) 中的 F 換为正常分布 

函败 F #{ dx } = e-**f{dr}，G 换为 G#{di} = e - fc *G{dx} 后得到的方程的解[其拉普拉斯变 
换为访 *(A) = V>(A + fc)]. 
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14.2 更新型方 程：例 

例 （a) 泊松过程中间埔的等待时间 •设 V 是在一个参数为 c 的泊松过程中（即 
在具有指数到达时刻间隔的更新过程中）到第一个长度为 C 的间隔结束时的等待时 
间的分布.在 II . 7 节例 （ b ) 中曾用分析方法讨论过这个问题.在 6.7 节中曾给出过 
它的经验解释（试图穿过交通流的行人或汽车的延迟， n 型盖格计数器的关闭时间 
等). 我们着手重新建立更新方程. 

从时刻0开始的等待时间必然大于$如果在时刻€前不出现到达（概率为 
e _ c { ), 或者如果第一次到达出现在时刻 x < f , 并且剩余等待时间< f -*,那么上 
述的等待时间在 t > €前终止.由于缺乏记忆性，所以对于 O 等待时间< * 的 
概率 K ⑷为 { 

V ( t ) = e ~^+ f V ( t - x )- e -^ cdx , (2.1) 

Jo 


对于* < ⑷ =0. 尽管它的外表比较陌生，但是（ 2 .1)仍是一个标准型 （1.1) 的 

更新方程，其中 F 的密度/⑷= ce -^ 集中于0<0：<€上，而 G 集中于点 f 上. 
于是 


_=- c 

■^(1 - e -( c + A X ), 7 ( A ) = e _( c+A ' 

( 2 - 2 ) 

因此 V 的拉普拉斯变换为 




姻 

(2-3) 


11.7 节 （7.8) 期望与方差的表达式可由上式通过简单的微分①得到，对高阶矩 
也是如此. 

从 （2.3) 导出解的一个 明显公 式是很有启发性的.由于明显的理由，我们转过 
来讨论分布 的尾部 1- V ⑴. 它的 普通拉普拉斯变换是 [1- 矽 ( A ) j / A 【见 13.2 节 (2.7)], 
此变换有一个几何级数展开式 

括号内的表达式与均匀分布的拉普拉斯变换 (1 - e - A )/ A 的不同之处，仅在于一个 
尺度因子€以及把 A 换成了 A + c . 正如我们一再说明的那样，这个变化是由于用 
e -^ 乘以密度而引起的.于是 

1 - 叩 )= e _ rt (2.5) 


①省略分母 & 然是为了避免冗长的分式微分. 
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其中 /"* 是均匀分布与其本身的 n 重卷积.利用 1.9 节 (9.6), 我们最后得到 

与覆盖定理的关系是有趣的.在 1.9 节 (9.9) 中曾证明，内层的和表示（对于固 
定的在 P 中随机选取 n -1个点，把此区间分为 n 个长度的部分的概年 .于 
是为使等待时间超过 t , 当且仅当旧的每个子区间至少包含一个到达，从而 (2.6) 
说明，如果在泊松过程中恰有 n -1个到达发生在取中，那么它们的条件分布是 
均匀的.如果从这个事实开始，那么我们可以把 (2.6) 作为覆盖定理的推论.换句话 
说， (2.6) 表示利用随机化得到的覆盖定理的一个新证明 • 

例 （ b > 复合泊松过程中的破产 问超. 作为第2个说明性例子，我们来讨论枳微分 
方程 

记⑷= (a/c)R(t) - {a/d)j R{t- (2.7) 

其中 F 为一个期望为 M < oo 的概率 分布. 这个方程是在 6.5 节中导出的，在那里 
讨论了它与集体风险理论、存储问题等等的 关系. 在例 11.7 节例⑷中用不同方法 
推导了它的解和渐近性质. 

问题是寻求一个满足 (2.7) 的概芈分布 R 这个方程与更新方程有关，可以用 
相同的方法进行 讨论. 取普通拉普拉斯变换并注意到 

p ( A ) = [ e~ Xx R(x)dx = A -1 jf °° e 一 圮⑻如 + X~ l R( 0 ). (2.8) 


我们可得 


p(A) = 


fl(Q) 



(2-9) 


其中 ¥> 是 F 的拉普拉斯变换.注意到【1 _ y )( A )]/ A 是1 - F(x) 的普通拉普拉斯变 
换，我们就可看出右边第一个分式具有 (1.4) 的形式，从而是一个测度 il 的拉普拉 
斯-斯蒂尔切斯变换.因子 1/ A 表示一个积分，从而 p ( A ) 是非正常分布函数 R(x) 
的普通 拉普拉斯变换[正如 (2.8) 所指出 的那样 1. 因为当 a : — oo 时 R(x) ^ 1,所以 
由 13.5 节中的定理4推出，当 A — 0时， p ( A ) -»1. 因此，我们从 (2.9) 可得，对于 
未知常数 H(0), 

R(0) = 1 - {a/c)fi, (2.10) 


于是我们的问题当< c 时有唯一的一个解，当 a/i > c 时没 有解. 这个结果可由概 
率背景预料到. 



418 第 14 幸拉普拉斯变换的应用 


公式 （2.9) 也出现在排队论中，名为辛钦-波拉杰克公式[见 12.5 节例 （ a )】. 许多论文 
推导出了特殊情形下的明显表达式，在純泊松 过租中 • F 集中于点1上， WA) = e_ x . p 的 
表达式几乎和 (2-3) 相同，同样的方法容易导致8•式解 

R ( x ) =( 1 ~f)E( : ?) fc (x ~k< k)+exp (f (* - fc )+) - ( 211 ) 

显然，这个公式没有实用价值，但是由于存在必须用奇特的方式消掉的正指数，这个公式 
是很有趣的.早在1934年就出现在集体风险①理论中，但是后来反复地被重新发现. 


14.3 包含反正弦分布的极限定理 

通常把集中在 on ■上且密度为 

9a(*) = ? ^x- Q (l-x) a - 1 , 0<a<l (3.1) 

的分布称为“ 广义反正弦分 布”，虽然它们是特殊的沒分布 .a = $的特殊情形对 
应于分布函数 2 n -» arcsinv / i , 这个函数在随机游动的起伏理论中起了重要的作用. 
研究与如有关的极限分布的论文越来越多.它们的复杂计算使如的出现#上去 
非常 神秘. 深刻的理由在于与具有正则变化尾部的分布函数有密切关系，即与 
具有形式 

1 - F(x) = x~ a L{x), 0<a< 1 (3.2) 

的分布有密切关系，其中当 t — oo 时 L ( te )/ L ( o ;) — 1. 对于这样的函数，可以把更 
新定理加以补充，也就是说，更新函数 = 满足 


y ⑴〜 


1 t a 

r(l-a)r(l + a)i(t)’ 


(3.3) 


换句话说，如果 F 是正则变化的，那么1/也是 如此. 已经知道（但不是显然的 )(3.3) 
中的常数等于 (sinna)/nQ. 从而 (3.3) 可以改写成如下 形式： 


[l-FC^Mx)- 


(3.4) 


引理 如果 F 具有 (3.2) 的形式，那么 (3.4) 成立 • 
证根据 13.5 节的陶伯定理4, 


① R. Pyke.The supremum and infimum of the Poisson process, Ann. Math.Statist., vol. 30 
(1959) pp.568-576 给出了在时期 t 前破产的 M 式解. 
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1 - ( fi ( X ) ~ r(l - a ) A a L ( l / A ), A ->0. 

U 的拉普拉斯变换是 5 V = 1/(1 - 办由 13.5 节的定理2, (3.3) 成立. ► 

现在考虑具有共同分布 F 的正值独立变量 A 的序列以及它们的部分和 S „ = 
A + … + X „. 对于固定的*>0,用风表示使 

Sn , < t < Sn,+i (3.5) 


的随机指标.我们对两个子区间 


= * — 5尺•和 Zt = SNt+i — t 

感 兴趣.它们在 6.7 节中曾作为时刻 t 时“已度过的等待时 间”和“ 剩余的等待时 
间”引入过.我们巳经从许多方面说明了这些变 M 的重要性.在 11.4 节中证明了， 
为使当 t — 00时变童 y t 和备具有共同的正常极限分布，当且仅当有有限期 
望. 但是在其他情形下，对于每个固定的 a ： > 0, P { y t < a :} - 0,对备也有类似的 
结论.下列有趣的定理作为我们的结果的副产品出现，但是原来的证明却是相当复 
杂的.① 


定理如果 (3.2) 成立，那么正规化了的变量 y t /t 的极限密度如由 (3.1) 给出，并且 
Z t /t 的极限密度为 ® 


sinna 



x°(l + x ) 


a : > 0. 


(3-6) 


证为使不等式 tei < F t < tx 2 成立，当且仅当 S „ = ty 且对于使 l - x a < y < 1 - Xl 
的某个组合 

-^ n+l > 4(1 - y ). 


对所有的 n 以及所有可能的 y 求和，我们得到 


P{txi < Y t < tii ) 




(3.7) 


从而利用 （3.4) 得 

于是 U ( ty )/ U ( t ) ^ y a , 从而测度⑴趋于密度为 o ^— 1 的测度，而第一 
个因子趋近于 (1-1/)-°. 由单调性，这种逼近是一致的，因此 


① E. B. Dynkin, Some limit theorems for sums of independent random variable with infinite 
mathematical expectatioru . 见 Selected 1>ans. in Math. Statist, and Probability, vol. 
1(1961)IMS-AMS, pp.171-189. 

② 因为 Siv.+l = ^ + t, 所以 Zt/S Nt+1 的分布可由 (3.6) 利用变换昝换 * = y/(l - y ) 而得軋 
由此可见 Zt/S Nt+1 也有极 R 密度 
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P { tx , < Y t < tx 2 } ^ j :- X ' y a ~\l - y )~ a dy , (3.9) 

这就证明了第一个断言，对于 P { Z t > ta }, 我们在极限0和 1/(1+ «) 之间得到同 
—积分，通过傲分就可得到 (3.6). ► 

—个值得注意的事实是，密度如在端点0和1附近变为无穷.因此， y t / t 的 
最可能的值位于0和1附近. 

把我们的论证作简单修改就可得到这个引理和定理之逆.那时就可看出 (3.2) 
是 Vt # 的极限分布存在的必要条件.另一方面， (3.2) 刻划了稳定分布的吸引域的 
特征，这就说明了为什么屯在与这样的分布有关的问题中经常出现. 

14.4 忙期与有关的分支过程 

在 13.4 节例 （ a ) 中曾证明，如果#是一个期望为 P 的概率分布 F 的拉普拉斯 
变换，那么方程 

0{ X ) = ^(X + c - c 0(\)), \>0 (4.1) 

有唯一的解/3,而且是一个分布 B 的拉普拉斯 变换. 此分布当 c M < 1时是正常分 
布，否則是亏损 分布. 这个简单的优美的理论越来越经常地被利用，因此说明 (4.1) 
的概率背录及其应用是值得的. 

如果我们习惯于直接利用拉普拉斯变换来表示概率关系式，那么 （4.1) 和类似 
方程的推导是很简 单的. 一个典型的情况如下.考虑一个随机和= X t +---+ X N , 
其中是拉普拉斯变换为 7( A ) 的独立变童， 7 V 是一个母函数为的独立变 M . 
Sn 的拉普拉斯变换显然是 P ( 7 ( A )) [见 13.3 节例 （ c )]. 对于一个泊松变量 AT , 这个 
拉普拉斯变换具有的形式.正如我们一再看到的那样.在应用中常取参 
数 a 为一个服从分布1/的随机 变贵. 如果采用分布函数的术语，那么我们可以说 
e 是在给定参数值《下 S W 的条件拉普拉斯 变换. 绝对的拉普拉斯变换可 

通过对 f / 的积分得到.由被积函数的特殊形式可知，结果显然是 w(l - 7( A )), 其中 
u ； 表示1/的拉普拉斯变换. 

例 （ a ) 忙期 .® 顾客（或呼叫）按照一个参数为 c 的泊松过程到达一个眼务员（或 
中转线） 那里. 假设逐次的服务时间是具有共同分布 F 的独立 变董. 假设有一个顾 

①忙期由 (4.1) 决定是肯达尔 （D. G. Kendall )*Some problems in the theory of queues, 3. R<qr. 
Statist. Soc.(B), vol, 13 (1961) pp. 151-185 一文中指出的.把它化为分支过程的优美的推导是 
由古徳 （I. J. Good) 给 出的. 方程 (4.1) 等价于 

B(t) e-* (t _ x)F{dx>, 

它常称为塔什克 (Taocs) 积分方程.这个理论的内在的简单性并不总是不言自明的. 
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客在时刻0到达，并且脤务员是空 闲的. 他的服务时间立即开始.在他的服务时间 
期间到达的顾客排成一队，只要还有人在排队，服务时间就不间断地继续下去.所 
谓忙期指的是从0到服务员又得空闲的第一个时刻的时间间隔.它的持续时间是 
一个随机变量，我们分别用 S 和泛表示它的分布和拉普拉斯变换. 

利用分支过程的术语，使繁忙期开始的頋客是“祖先”，在他的服务时间内到 
达的顾客是他的直系后裔，等等.假定祖先在时刻： C 离去，他的直系后裔的个数 
iV 是一个期望为 cx 的泊松变董•用表示第 j 个直系后裔及其所有后裔的总 
的服务时间.虽然这些服务时间不一定是连续的，但是它们的总的持续时间和忙 
期显然有相同的分布.因此，所有（直系和非直系）后裔所需要的总的服务时间是 
= A + + ，其中七的拉普拉斯变换为0且所有的变童是独立的.对于忙 

期，我们要加上祖先本身的服务时间: c . 因此，给定了祖先的服务时间的长度，忙 
期 a : + 的（条件〉拉普拉斯变换就是参数: c 的分布为 F , 关于 x 
积分就得出 (4.1). 

如果 S 是亏损的，那么亏世1 - B { oo ) 表示有一^永不结束的忙期（拥挤）的 
概率. 条件叫<1表示单位时间内到达的頋客的平均总服务时间一定不大于1•容 
易从 (4.1) 计算出 B 的期望与方差. 

在相數服务时间的特殊情形下， F ⑷= = a/(A + a ). 在这种情 
形下， (4.1) 化成一个二次方程，它的一个根在无穷远处是无界的.因此，卢和另一 
根一致，即 

( 42) 

这个拉普拉斯变换曾出现在 13.3 节例 （ c ) 中.考虑到改变了的尺度参数和平移原 
理，我们可看出对应的密度为 

y/ajc e - ( a + c ) * x _1 / i (2 v/ac x ). (4.3) 

在 14.6 节例 （ b ) 中将用另一方法导出同一结果，它曾被应用于 6.9 节例 （ e ) 中. 

例 （ b > 交通中的延迟 .® 假设通过公路给定点的汽车符合一个参数为 c 的泊松过 
程. 设交通停止一段长度为的时间（由于红灯或其他原因).当交通重新开始时 ， K 
辆汽车将排队等待，其中 K 是一参数为的泊松变董.由于队中第 r 辆汽车不能 
先千它前面的 r - 1辆开动，所以队中每辆汽车对跟在它后面的所有汽车都引起一 
个延迟.自然假设这些延迟是具有共同分布 F 的独立随机变童.在一个队列的持续 

①本例是在李特尔 （J. D. C. Little) 在关于被«迟了的汽车的数量的讨论的启发下给出的. (Opera¬ 
tions. Res., vol. 9(1961)pp. 39-52.] 
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时间内，新到达的汽车被迫加入这个队列，因此增加总的延迟.这种情况和上例一 
样，只是这里有个“祖先' 由每辆汽车、它的直系和非直系后裔所引起的总的 
延迟的拉普拉斯变换满足 （4.1), 总的“忙期 • （从交通重新开始到不再有汽车等待 
的第一个时刻止的时间间隔）的拉普拉斯变换为 

容易计算出平均延迟，我们可以利用这个结果来讨论逐次的交通管理色灯的影响 
等问题（见习题6和习题 7). ► 


14.5 扩散过程 

在一维布朗运动中转移概率是正态的，首次通过时间的分布是指数为1/2的 
稳定分布[见 6.2 节例 （e)】. 由于有这些明显的公式，所以我们不应希望通过拉普拉 
斯变换来得到新的 信息. 重新从扩散方程开始的原因是这种方法是有益的，并且可 
应用于最一般的扩散方程中（除了在系数为任意时，不能指望得到显式解以外).为 
了简化书写，我们承认转移概率 Qt 具有密度 ft 这件事（虽然在没有特殊假设时也 
可利用即将叙述的方法得到这个结果). 

我们从布朗运动这一特殊情形开始.对于一个给定的有界连续函数/,令 

u ( t , x ) = J qt { x , y ) f ( y ) dy . (5.1) 

我们的出发点是 10.4 节例 （a) 中导出的事实，即（至少对于充分光滑的 /)« 满足扩 
散方程 

du ( t , x ) 1 a 2 u(«, a:) , 

~W- = 2~d^- (52) 

和初始条件：当 t — 0时， u ( t , x )^ f ( x ). 利用普通拉普拉斯变换 

fOO 

ivx ( x ) = J e ~ M u { t , x ) dx , (5.3) 

我们由 (5.2) 可得 ® 1 

九办 一 2 W =爻 （ 5 - 4 ) 

由 (5.1) 可得 

wx(*) = J Kx { x , 8 ) f { s ) Aa , (5.5) 


①读过有关半群的*几节的读者将会注意到，我们讨论的是微分算子 il = Ad2/d* 2 产生的马尔可 
夫 半銲. 徽分方程 (6.4) 是在希尔-吉田定理中出理的 13.10 节 (10.1) 基本方程的待珠情形. 
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其中 K ^{ x , y ) * q t { x , y ) 的普通拉普拉斯变换.在撖分方程中，称为 (5.4) 的格 
林 ( Green ) 函数.我们来证明 


Kx ( x , y ) = (5.6) 

这个公式的正确性可以通过验证 (5.5) 表示微分方程 (5.4) 的所要求的解来证明，但 
是这并不能说明这个公式是怎样得到的. 

我们提议用概率论证来推导 (5.6), 这种论证可应用于更一般的方程并导致基 
本首次通过时间的明显表达式（习题 9). 我们假设已知轨道变童 X ( t ) 连续地依赖 
于设 X ⑼= z , 用 F ( t , x , y ) 表示在时刻 f 以前到达点 y 的概率.我们称 F 是从 
: c 到 y 的首 次通过时刻的 分布，并用 Vx ( x , y ) 表示它的拉普拉斯变换. 

对于 a : < y A 为使事件义⑷= * 发生，当且仅当首次通过 y 发生在某个时 
刻 t < 然后在时间 t - r 内从 1 /转移到 2 . 于是 q t ( x , z ) ^ jP ( t ,; c , y ) 和的 
卷积，从而 

K x ( x , z ) = ip \( x , y ) Kx ( y , z),x < y < z . (5.7) 

固定点 y 并取/为一个集中于 v ^ o 上的函数•用/⑷乘 (5.7), 并关于2取积分. 
由 （5.5) 看出，结果是 

w A ( a :) = ipx ( x , y ) uj x ( y ), X>y. (5.8) 

而 (5.4) 要求对于固定的 y ,< px ( x , y ) 满足微分方程 

- = x (5-9) 

在 - oo 上有界的解一定具有 Cxe -^ 的形式 •因为 （5.8) 说明，当 a : — y 时， 
< px ( x , y ) 1,所以当 ® < y 时我们有 Mx , y ) = 当 z > v 时可以利用类 

似的论证，显然，由对称性，从: t 到1/ 的首次遢过时间的拉普拉斯变换为 

fx { x , v ) = (5.10) 

因此在 (5.7) 中令* = y , 我们可看出 

Kx { x , y ) = e -' m \ x -^ Kx ( y , y ). 

因为 K 必须对称地依嫌于 z 和 y , 所以 K { y , y ) 是一个只依赖于 A 的常数 C A . 于是 
除了一个乘积常数 C x 外，我们已经确定了 容易由下列事实推出 y / 2 XC x = 1： 

对于/ = 1有相应的解 « a (*) = 1/ A . 这就说明了 (5.6) 的正确性. 
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下例说明怎样计»在到达另一点 V2 < x 之前到达点 Vl > x 的概率.同时它们 
说明怎样处理边界条件. 

例 （ a ) —个吸收壁.当一个满足 X ( 0 ) = x > 0 的普通布朗运动到达原点时令它停 
止，我们就得到了 0^5上的在原点上有一个吸收壁的布朗运动.我们用 9 t abs Oc ， J /) 
表示它的转移密度，并类似地采用其他记号. 

在无约束的布朗运动中，一个从 a : > 0到 y > 0( 中间通过 0) 的转移的概 
率密度是从 z 到0的首次通过密度和 q t ( 0 , y ) 的卷积.对应的拉普拉斯变换是 
外 (®，0) Jf A (0, y ), 从而我们一定有 



= K x ( x , y ) - < p x ( x , 0 ) X ^ 0 ^), 

(5.11) 

其中 3 ： > 0, 

y > 0 . 这等价于 



尺5**(®，!/) = [ e _ '^ X|l - y| - e -^(*+»)]/^A 

(5-12) 

或者 

^(x, y ) = q t ( x , y ) - q t ( x , - y ), 

(5.13) 

这和用反射原理得到的 10.5 节 (5.5) 解一致. 



导致 (5.7) 的论证也适用于吸收壁过程，我们从 （5.12) 可得，对于0 < a : < y , 




e V5A x _ e -V2\ x 
qV 2\ y _ g—V2A y 


(5-14) 


这®是 在满足 X (0) = a : 的无约束布朗运动中在时刻 t 之前且在通过原点之前到达 
点1/ > a : 的概芈的拉普拉斯变换.令 A - 0,可得在通过原点之前到达 y 的概牟等于 
x / y , 这与在对称伯努利随机游动的情形一样（见第1卷 14.2 节中的破产问题 ).（ 在 
习题8中继续讨论 .） 

例 （ b ) 两个吸收壁.现在考虑一个从中的点 a ： 出发而在到达0或1时终止的 
布朗 运动. 通过在上述吸收壁过程中引入一个位于1点的附加的吸收壁来推导本例 
的过程最容易，因而导致 (5.11) 的论证仍然有效.因此，新过程的转移密度 qf ( x , y ) 
的拉普拉斯变换为 

Kf ( x , y ) = K ^( x , y )~ ^( x , 1)^(1, y ), (5.15) 


其中 a : 和?/局限于 DTT . [注意，边界条件 Kf ( 0 , y ) = K *( l , y ) 是满足的 . j 简单的 
算术运算表明， 


^*{ x yV) 


e -^X|*-j>| + g-V , 2A(2—|x—v|) _ g—V^A(*+») _ e —^/2X^2-x—y) 
v /2 A(l - e - 2 ^*) 


(5.16) 


①对于固定的表示微分方程 (5.9) 的解，此解当 x = 0 时化成0,当 * = v 时化成 1. 在这 
种形式下，结果适用于三点组 a<a:<6 和 a>:t>b 及更一般的徽分方程. 
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把 l /[ l - e - 2 ^] 展成几何级数，我们得到另一种表达式 

(*.») = ~7= ^ [ e - V 2 A |*-«+2 n |_ e -^ A |*+ V +2 n | j } (5.17) 

* n=—oo 

这等价于由反射原理得到的 10.5 节 (5.7) 解. ► 

同样的论证适用于有限或无限区间上的更一般的扩散方程： 

^^ a(x) ^l +Hx) ?^l, a>0 . (5 , 8) 

代替 (5.4), 我们得到 

Aw a _ - bui' x = f , (5.19) 

解也具有 （5.5) 的形式，其中 iG 是一个形如 （5.7) 的格林函数[在 （5.7) 中 ifi X { x , v ) 
是从 a : 到 j / > * 的首次遒过密度的变 换]. 对固定的 y , 此函数一定满足对应于 (5.9) 
的微分方程，即 

Va - ^ aip'x - lxp' x = 0. (5.20) 

它在左端点一定是有界的，且外= 1.除了 (5.20) 有一有界解的情形外，这些 
条件唯一地确定了 在 (5.20) 有一有界解的情形（和上例一样）必须加上适当的 

边界条件. 

14.6 生灭过程与随机游动 

在本节中，我们将研究第1卷 18.5 节中的生灭过程和 2.7 节中的随机化了的 
随机游动之间的 关系. 主要的目的是要举例说明涉及到拉普拉斯变换的技巧以及 
边界条件的正确利用. 

考虑一个从原点出发的简单随机游动，其中每一步等于+1和 -1 的概率分别 
是 P 和 9. 假设相邻的各步之间的时间是服从期望为 1/ c 的指数分布的独立随机变 
请.在时刻《位于位置 n 的概率 P n ( t ) 曾在 2.7 节 (7.7) 中求出过，但是我们从新的 
角度出发重新开始.为了导出 P n ( t ) 的方程，我们作如下讨论.只有当在时刻 f 之 
前发生跳跃时，才可能在时刻 t 位于 n # 0. 假设首次跳跃在时刻 f - a : 发生且到达 
1,在时刻 < 位于位置 n 的（条件）概率是 Pn .^ x ). 因此，对于 n = ±1, ±2,…， 

P n ( t 、 = j: ce -^'^ lpPn - iCx ) + gP n +1 ( x )] dx . (6.1 a ) 

对于 n = 0, 必须加一项 e _ rt ， 以表示直到时刻 t 没有发生跳跃的可能性.于是 

P 0 ( t ) = e - 64 + ce -^*-*) \ pP - i ( x ) + 9 P 1 ( i )] dx . (6.1 b ) 
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因此， P „ 必须满足无穷的卷积方程组 (6.1). 利用简单的微分可导致无穷撖分 
方 程紐？ 

= ~cPn(t) + Cp^n-l(*) + Cq P n+l(t) (6.2) 

和初始条件玲⑼=1,对于 n / 0, M0) = 0. 

方程组 (6.1) 和 (6.2) 是等价的，但是后者有一个形式上的优点，即 n = 0的特 
殊作用只有在初始条件中才能看出来.对于拉普拉斯变换的应用来说，我们从何处 
下手是无关紧要的. 

我们转向讨论拉普拉斯变换，令 

^ n ( A )= [°° e ~ Xt P n ( t ) dt . (6.3) 

Jo 

因为卷积对应于拉普拉斯变换的乘积，的变换为 l/(c + A ), 所以方程组 (6.1) 
等价于 

TTn (入)= [ p ^ n - l ( A ) + «7 Tn + l ( A )], n ^ 0, (6.4 a ) 

w o ( A ) = 十 —^[ pff - i ( A ) + ( A ) l ， (6.4 b ) 

1 同样的结果可由 （6.2) 得到，因为 

j : ⑴ d * = - A ⑼ + A 7 r „( A ), 

此式可用分部积分公式推出 .j 

线性方程组 (6.4) 与在第 1 卷第 14 章中遇到的随机游动方程有相同的形式， 
我们用同一方法来解它.二次方程 

cqa 2 - (c + X)s + cp = 0 (6.5) 

的根为 

和 ㈣ 

容易验证，对于任意常数 Ax . Bx , 线性组合 TTn ( A ) = Axa ^ + 满足 (6.4 a)(n = 
1,2, …)，系数可以这样选取，以便得到 tt 0 ( A ) 和 7 n ( A ) 的梢 确值. 给定 呵 和 m ,可以 
从 (6.4 a ) 递推地算出 tt 2 , 办，…， 从而对于 n > 0, 毎个解具有 tt „( A ) = A x8 ^ + B x < r ^ 
的形式.当 A — oo 时， s x — 0,但 — oo . 因为我们的 ir n {\) 在无穷远处是有界 
的，所以我们必须有 Ba = 0,从而 

^ n ( A ) = Jr 0 ( A ) s ", n = 0, l ,2, (6.7 a ) 

①它们是第 1 卷第 17 聿，一般生灭过程的方程 (5.2) 的一个特殊情形，可以用类似的方法推导出来. 



对于 n <0, 我们可类似地得到 
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霄 n ( A ) = 5 To ( A )< t " = ( p / q ) n ir 0 ( X ) sl n , n = 0,- l , -2, … . 
代入 (6.4 b ), 我们最后得到 


7T 0 ( 入 ）= 


v /(c + A ) 2 -4 c 2 pg ， 


(6.7 b ) 


( 6 . 8 ) 


因此，所有的 7 r n ( A ) 是唯一确定的. 

即使不知道解的明显公式，也可以从这些拉普拉斯变换得到许多信息.例如， 
因为拉普拉斯变换的乘积对应于卷积，所以由 （6.7) 的形式似乎 应有： 对于 n >0, 
概率 P „ 具有的形式，其中 F 是一个变换为 sa 的（可能为亏损的） 
概率分布.这个猜想可以用概率论方法验证如下.如果在时刻 t 随机游动位于点 n , 
那么首次通过 n —定发生在某个时刻 T ^ t . 在这种情形下，在时刻 t 又位于点 n 的 
(条件）概率等于 Po(t-r). 于是是 P 0 和首次通过 n 的时刻的分布的卷积 • 
这个首次通过时间又是 r » 个同分布独立随机变董的和，即依次通过1,2,…, n 之间 
的等待时间 之和. 这就说明了 (6.7) 形式，并同时证明了切对于《 > 0) 是首次通 
过 71 的分布凡的 变换. 除非 p = g = |,这个分布是亏损的，因为只有在 P = Q = \ 
时 So = 1. 

在现 在的情形下,我们幸好可以把变换 SA 逆转.在 13.3 节例⑷中曾证明，（入- 
V ^ T )* •(对 A > 1) 是 [ r / x ) Ir { x ) 的普通拉普拉斯变换.把 A 换成 A /2« V 两只改 
变了一个尺度因子，把 A 换成 A + c 表示用 e - 0 * 乘以密度.由此推出 4( 其中 n >0) 
是密度为 

/ n ( t ) = y/(p/q) n nt^I^Cy/pqt^ 1 * (6.9) 


的分布 F n 的普通拉普拉斯变换. （6.9) 是首次通过 n > 0的时间的密度.在 2.7 节 (7.13) 
中曾用直接方法证实过这个事实1 从而现在的论证可以看作为的拉普拉 
斯变换的一个新推导 1. 

可以类似地得到概率 P „( t ) 的一个明显表达式.在 13.11 节的习题8中我们求 
出了夂 的拉普拉斯变换，刚才叙述的参数调整直接导致明显公式 

Pn ( t ) = \/( p / g )" e - ct / n (2 cVM t ), n = 0，± l ，±2,_... (6.10) 

此外，这个结果可由 2.7 节 (7.7) 中的直接方法导出. 

正如我们在第1卷 17.7 节中看到的那样，除了被局限于 n >0 以及对于边界 
状态 n = 0有一个相应的不同方程外，各种中继线和服务问题都导致同一微分方 
程组 (6.2). 下面两个例子将说明在这样的情形下怎样运用现在的方法. 
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例⑷ 一个服务员的排队. 我们考虑一个服务员，如果服务员 忙着， 那么新来的顾 
客就要排队.系统的状态由排队的顾客（包括正在得到服务的顾客）的人数 n > 0给 
出.到达时刻间隔和服务时间是相互独立的，且分别具有指数密度 Ae - M 和 / xe - M *. 
这是第1卷 17.7 节中多个服务员的例 （ b ) 的一个特殊情形，但是我们将重新推导 
微分方程，以便说明它和我们现在的随机游动模型的密切关系. 

假设现在有 n - 1个顾客在排队.状态的下一个变化是 +1( 如果它是由于新顾 
客的到来引起的）和- 1( 如果它是由于现在的服务时间终止而引起的).这种变化的 
等待时间： T 是这两个事件的等待时间的较小者，从而 P{r > t } = e -^, 其中我们 
设 c = A + / i . 当变化发生时，它以概率 P = A / c 等于+1,以概率 9 = M / c 等于 
-1. 换句话说，只要仍有人在排队，我们的过程就符合随机游动模型，从而微分方 
程 (6.2) 对 n > 1成立.但是当服务员空闲时，变化只能由新顾客的到来引起，因 
此对于 n = 0,微分方程呈形式 

巧⑷= - cpP 0 { t ) + cqP ^ t ). (6.11) 

假设服务员原来是空闲的，即 Po (0) = 1,我们现在来解这些微分方程.对于 
n > 1,拉普拉斯变换 7 r n ( A ) 又满足方程 (6.4 a ), 但是对于 n = 0,我们由 (6.11) 得到 

( q > + A ) iro ( A ) = 1 + cqni ( A ). (6.12) 

和在一般的随机游动中一样，对于 n ^ l , 我们得到 7 r n ( A ) = tt 0 ( A ) 巧，但是由 (6.12) 
看出， _ 

7To(A) = - — - = ― (6.13) 

Cp + X - CQ8X X V ' 

于是 _ 

冗 n ( A ) + 甘》»+1(入) + ••• = —+ ®" +1 +•••) = ®"/ A . 

我们知道，吆是密度为 (6.9) 的分布 F „ 的拉普拉斯变换，因子 1/ A 相应丁•积分.因 
此，对于 n >0 

Pn ( t ) + p „+ i ( t ) + …= F n ( t ), (6.14) 

其中八是密度为 (6.9) 的 分布. 对 n = 0, 左边当然是 1. 

例 （ b > 忙期中的起伏. 我们考察同一个服务员，但是只在忙期中考察他.换句话 
说，假设第一个顾客在时刻0到达空闲的服务员那里，我们让过程在服务员变成 
空闲时终止.从分析上讲，这邃含现在 n 局限于 n > l , 初始条件是 A ⑼=1.对 
于 n > 2,微分方程 (6.2) 没有什么变化，但是由于没有零状态，第一个方程的项 
cpPoit ) 消 失了. 于是当 n 彡2时拉普拉斯变换 7 r n ( A ) 满足 (6.4 a ), 对于 n = 1满足 


(A + c ) iri ( A ) = 1 + cqir2 ( X ). 


( 6 . 15 ) 
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同前，对于 n ^2, 我们得到 jt „( A ) = 但是冗 iW 将由 (6.15) 确定. 

简单的计算表明 ttx ( A ) = exKcp ), 从而 ir n ( A ) =枚(印) . 于是利用上例我们可得到 
最后的 结果： P „(<) = fn(t)/(cp), 其中/„由 （6.9) 给出. 

为了保证忙期有有限的持续时间，我们假设 p < g .用: T 表示忙期的持续时间. 
那么 P{T > t } = P ( t ) = J ： P n ( t ). 于是 P \ t ) = - cqP 1 ( t ), 这可通过把诸微分方程 
相加得到，也可用如下的概率方法得到.如果忽略具有可忽略的概率的事件，那么 
为使忙期在 * 和 t + h 之间终止，当且仅当在时刻 f 只有一个顾客在排队，且他的 
服务在从 t 开始的长度为 ft 的下一个时间区间内 终止. 这两个条件的概率分别为 
i \( t ) 和 cqh + o { h ), 从而 r 的密度满足条件 - P ' it ) = 叫巧⑴.因此，忙期的持续 
时间的密度为 _ , 

- P ^( t ) = y / q / pt ~ 1 Ii (2 cy / pqt ) e ~ ct . (6.16) 

这个结果曾在 12.4 节例 （ a ) 中用不同的方法导出过，并且曾被利用于 6.9 节例 （ e ) 
排队过程中.（见习题 13. ) p . 


14.7 科尔莫戈罗夫微分方程® 


我们回到局限于整数1,2,…的马尔可夫 过程. 我们曾在第1卷 17.9 节和 10.3 
节中推导过科尔莫戈罗夫微分 方程. 本节包含一个利用拉普拉斯变换所作的独立论 
述. 为使讨论自给自足，我们给出（以卷积方程的形式给出的）基本方程的一个新 
推导. 

基本假设是，如果在某个时刻 T,X(T)=i, 那么在区间 + r 内， X ( t ) 
的值将保持不变（此区间的长度具有指数密度它然后跳跃到 h 的概率是 
PH - 给定 X(0) = i, 那么 X ( t ) = k^i 的概率 P ik ( t ) 现在可以通过对所有可能的时 
刻以及首次跳跃的结果求和计算 出来： 

OO -I 

只 *(*) = [ / Cie _ Ci */> y i ^ fc ( t - ar ) d ®， (k / *)• (7.1 a ) 

i = i Jo 

对于 k = i , 我们必须加上一项以说明不发生跳跃的可能性： 

Pa(t) = e -c,t + c<e _Ci *P<id i)di. (7.1b) 


①本节叙述的理论不经本质的改变就珂应用于 10.3 节的一液珧跃过程.不用拉普拉斯变换而用槪率 
本身来重新叙述其证明将是一个很好的 练习. 这样证明就不那么优美了，但是此时这个理论可以 
推广到系败 Cj •和 巧* tf 依赖于 t 的非平情形 . W. Fteller, IVans. Amer. Math. Soc., vol. 
48(1940)pp. 488-515 [erratum vol. 58, p. 474 ] 对一般的跳跃过程讨论了这种形式的理论 • 
关于以样本轨道为基 《 的* 率 处理.见钟开蕹 (1967). 关于向半马尔可夫过程的推广见习 * 
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这些方程可用科罗内克符号 <5 ifc 统一起来，当 fc = ★时氏 fc = 1,当 * _ i 时心= 0. 

向后方程 (7.1) 是我们的出发点®,给定 任意的 c * > 0和一个 随机矩阵 P = 
( Pifc ), 我们来求满足 （7.1) 的随机矩阵尸⑴= ( P ifc («))- 

另外，如果我们假设任一有限时间区间只包含有限个跳跃，那么我们可以通过 
在 t 之前的最后一个跳跃的时刻来修改这个论证.从 j _ 向 A 的跳跃的概率的密度 
为 E ^( x ) c jP j fc , 而在 a : 和 t 之间没有跳跃的概率等于代替 (7.1), 我们 
得到向 前方程 


Pik ( t ) = S ik e- ett + jf 4 £ (7.2) 

然而正如我们将要看到的那样，存在一个具有无穷多次跳跃的过程满足向后方程， 
从而构成过程的基础的基本假设并不蘊含向前方程.这种现象曾在 10.3 节和第1 
卷 17.9 节中讨论过. 

利用拉普拉斯变换 ^ 

i7<*(A) = jf°° e - Xt Pik ( t ) dt , (7.3) 

向后方程 （7.1) 呈形式 

订认⑶ = y + c ^ + r +^ ( 7 . 4 ) 

我们现在转向更方便的矩阵 记号. （矩阵计算法则同样适用于具有非负元索的无穷 
矩阵 .） 我们引入矩阵 i 7( A ) = ( n ik ( X )), 类似地引入矩阵 P ( t ) = ( P ik ( t)),P = ( Pifc ) 
及具有元素 q 的对角矩阵 C , 我们用丨表示所有元素都等1的列向置.于是矩阵>1 
的行和为 A 1. 最后 J 是单位矩阵. 

于是由 (7.4) 显然可见，向 后方狂 (7.1) 可以转化为 

(A + c)U(A) = I + cp/7(A), (7.5) 

向前方*可以转化为 

n{X)(X + c ) = I + U(A)cp. (7.6) 

①引入变 董替换 y = t-x 可使我们容易进行徽分.可以看出，卷积方租 (7.1) 等价于歎分方程组 
= -CiPik(t) + 53 Pii p M*) 


和初始条件⑼=1,巧*⑼= 0(* # i ). 这个方程组和第1卷 17.9 节 (9.14) 一致，》不同 
的只是那里的系败 c * 和 po 依賴于时间，从而 Afc 是2个时 * j r 和 t 的函数，而不是持续时间 
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为了 构造最小解， 我们递推地设 

(入 + c ) i ! ⑼ ( A ) = J，(A + c ) n { X + 1 \ X ) = / + cpn ^ n \ X ). (7.7) 
对于 JT < n >( A ) 的行之和，我们引入记号 

AU (n) (A)l = l-4 (n) (A), (7.8) 

代入 (7.7) 并注意到 ？>1 = 1, 就可看出 

(A + c)e<" +l >(A) = cpe (n) (A). (7.9) 

因为《⑼= 0,所以对于所有的 n ,4<»)( A ) > 0,从而矩阵 Ail ⑻ ( A ) 是次随机的.它 
们的元索是 n 的不减函数，因此存在一个有限极限 

n {oo \\) = JT ( n ) ( A ), (7.10) 

并且 Ail (°°>( A ) 是次随机的或随机的 • 

显然 iT ( oo ) ( A ) 满足向后方程 （7.5), 对于任一其他非负解 iT ( A ) 我们显然有 
J 7( A )> U (0) ( A ). 根据归纳法，对于所有的 n 有 U { X )^ n ^ n \ X ). 于是 

21( A ) > JI ( oo ) ( A ). (7.11) 

iT ( oo ) ( A ) 也满足向前方程 （7.6) 这件事并不显然.为了说明这一点，我们用归 
纳法来证明 

n {n) (\)(\ + c ) = i + n { n ~ l \ x ) cp . (7.12) 

这对《 = 1是正解的.假设 (7.12) 成立，代入 (7.7) 就可得到 

(A + c ) n ( n +1 >( A)(A + c ) = \I + c+[I + C pJT < n - 1 )( A )] cp . (7.13) 

括号内的表达式等于 （A + c ) JI < n ) ( A).S (A + c )- 1 左乘 (7.13) 就可得到把 n 换成 
n + 1 的 (7.12). 因此这个关系式对所有的《成立，从而 iI ( oo ) ( A ) 满 足向前方程. 

重复导致 (7.11) 的论证，我们同样可以看出向前方程 (7.6) 的任一非负解满足 
77( A ) ^ 由于这个原因， iT ( oc > ( A ) 被称为 最小解 • 

定理 1 存在一个行和 < A - 1 的矩阵卩 ㈣ ⑶ > 0, 它满足 (7.5) 和 (7.6), 且对于 (7.5) 

或 (7.6) 的每 一个非 负解， 不等式 (7.11) 都成立. 

定理2 最小解是这样一族次随机或随机矩阵 P ⑷的拉普拉斯变换， P ⑷满足查普 

曼-科尔奠戈罗夫方程 

P( 8 + t) = P{s)P(t) ( 7 . 14 ) 
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以及向后方程和向前方程 (7.1) 和 (7.2). 或者所有的矩阵 _P ⑷和 AJT ( oo ) ( A )(< > 
0,入 > 0) 都是严格随机的或者都不是严格随机的. 

证我们去掉上标 oo , 把 H ( oo ) ( A ) 记为 71( A ). 由定义 (7.7) 显然可见 i 4 n )( A ) 是 
正函数 /^ n ) 的变换，这个 /^ n ) 是有限多个指数分布的卷积.由 （7.8) 知，⑴ 
的行和构成一个以1为界的单调序列，由此推出 n ( X ) 是一个次随机或随机矩阵 
P(t) 的变换.由 （7.5) 和 (7.6) 显然可见 P(t) 满足原来的向前方程和向后方程.这 
些结果蕴含 P{t) 连续地依赖于由此推出，如果对于某个 t , 第 i 行的和小于1， 
那么对于所有的 A , JT ( A ) 的第 i 行的和小于 A - 1 ,反之亦然. 

为了用拉普拉斯变换重新叙述 （7.14), 我们用乘以 (7.14), 并对 s 和 f 
积分.右边导致矩阵乘积 n{X)n(y), 左边容易通过代换 x = t + a, + s 来 


计算. 结果是 


n(X) 
v — X 




(7.15) 


反之， (7.15) 组含 (7.14). [这个论证曾用于 13.8 节 例⑷中 . I 
为了证明 (7.15), 考虑矩阵方程 


(A + c)Q = A + cp Q . (7.16) 

如果 A 和 Q 是非负的，那么显然 Q>(X + c)~ l A = JT ⑼ ( A )> l . 根据归纳法，对 
于所有的 n 有 Q 彡 J 7 ( n ) ( A ) A . 因此， Q 彡 n ( X ) A . 于是 n { y ) 满足具有4 = 
/ + ( A - v ) U { y ) W (7.16), 从而对于 A > i /, 


n{y)^ i7(A) + (A- i/)iT(A)JT(i/). (7.17) 

另一方面，右边的项满足把 A 换成1/的向前方程 (7.6). 由此推出它> .因 
此， (7.17) 中的等号成立.这就完成了证明 .® ► 

为了看一看矩阵 \ n ^\ X ) 是不是严格随机的 ®, 我们回到关系式 （7.8) 和 
(7-9). 因为诸元素是 n 的不增函数，所以存在一个极限 CpO = lim€ ⑹ (A), 
使得 

AU(°°)(A)l = l-e(A) (7.18) 

和 

_ (A + cK(A) = cpC(A), 0 ^ ^(A) < 1 . (7.19) 

① (7.15) 是有界列向 ft 组成的巴♦赫空间上的收* 笄子族 Afl ( A ) 的®解方程.我们在 13.10 节中己 
看到.为使它成立.当 a 仅当这些变换的值域是与 A 无关的，最小特征保证了这一点（利用边界理 
论，值域的特征是在••实际出口边界 ■ 上向 置等于 0). 

® 笋许.用列向 ■ 1乘以向前方程似乎可以导致恒等式 AH ( A )1 = 1,但是所涉及到的级敫可能发 
敢.如果 q 是有界的，那么这个程序是合理的（系 1). 
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另一方面，我们有 

(A + c ) 石⑼ (A) = cl = cpl. (7.20) 

因此，对于满足 (7.19) 的任一向量 （( A ), ^ f ( A ) •由归纳法可从 (7.9) 推出， 

对于所有的 C ( n ) ( A ) ^ €( A ), 从而 (7.18) 中的向量 f ( A ) 是满足 (7.19) 的最大向 
童.于是我们有 

定理3 最小解的行亏量可以由满足 (7.19) 的完全确定的最大向量 C ( A ) 来表示 • 
因此，为使 AJ 7^( A ) 是严格随机的，当且仅当 (7.19) 道含= 0. 

系1 如果对所有的 i , c i ^ M < oo , 那么最小解是严格随机的（因此，向前方程 
和向后方程都不具有其他的解). 

证因为 c/(X + c ) Mr . 的增函数，所以根据归纳法可从 (7.19) 推出，对于所有的 
n , 

(W ^(aTm) -1> (7 - 21) 

因此 €( A )=0. ► 

如果 A ( A ) 是由形如 ^( A )%( A ) 的元索组成的矩阵 | 其中 r ? fc ( A ) 是任意的那 
么 JT ( A ) + A ( X ) 也是向后方程 (7.5) 的解.总可以选择这样的 A (\), 以便得到是满 
足査普曼-科尔莫戈罗夫方程的容许矩阵 P ⑴.我们将在 14.8 节中举例说明这个 
程序. 对应的过程的特征可由在有限时间区间内包含无穷多个眺跃的转移来刻划. 
非常奇怪的是，即使用最后一次跳跃对它们所做的解释是错误的，向前方程也可以 
被满足. 

这些是主要的 结果. 我们用一个准则来结束本节，这个准则在应用中是有用 
的，而且它非常有趣，因为它的证明引进了位势理论的概念， （7.25) 的核尸是一个 
典型的位势. 

我们假设 A > 0,并把 (7.19) 改写成形式 

4( A ) + Ac - 1 $( A ) = |» e ( A ). (7.22) 

用乘以上式并对 fc = 0, l , …, n -1 求和，我们得 

n— 1 

€(A) + P fc c _1 $(A) = p"C(A). (7.23) 

fc=o 

这蕴含 P n $( A ) 单调地依赖于 n , 从而 p " C ( A ) : c , 其中; r 是满足① 

px = x , (( i ) < a : < 1 (7.24) 

①不难看出， a : 是与 A 无关的，且 =*-{( A ). 
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的最小列向量. 
现在用 


r = fy c -i 


(7.25) 


来定义一个矩阵（它可能具有无穷多个元素 )_ 在 (7.23) 中令 n — oo , 我们得到 


^( A ) + Ar ^( A ) = x . (7.26) 

特别这蘊含，对于每个使 r fcfc = oo 的 ^ fc ( A ) = 0.如果是矩阵为 P 的马尔可 
夫链的常返状态，那么情况是这样的，因此我们有 

系2当矩阵为 P 的离教马尔可夫链只有常返状态时，最小解是严掊随机的（从而 

是哚一的). 


14.8 例： 纯生过程 


在本节中我们不研究一般理论，而是详细地考虑只可能有形如 i -»< + 1的转 
移的过程，因为它们为由非唯一性产生的过程的类型提供了很好的例子.为了避免 
不足道的东西，我们假设对于所有的 *,^>0. 由定义 PM+1 = 1,而对于所有其他 
的组合= o . 于是向后方程和向前方程化为 


(入 + Cj)i7ifc(A) - Cj77 i+ i, fc (A) = S ik (8.1) 


和 


(A + Cfc)flifc(A) — Cfc_i77i,fc_x(A) = Sik, 


其中当 i = A : 时么*等于 1, 否则等于 0. 为了简单起见，我们令 


Pi = ^ 


Cj + V 


(8.2) 


(8-3) 


Pi 是在 i 上的逗留时间的分布（它是指数型的）的拉普拉斯变换， n 是这个逗留时 
间超过 t 的概率的普通拉普拉斯变换.要记住和朽对 A 的依赖性. 

例 （ a ) 最小解.容易验证 


n ik (\) 


PiPi+l ■ • ■ Pk - lTk , 

0 , 


k > i , 
k < i . 


(8-4) 


是 (8.1) 和 (8.2) 的最小解.它反映了这样的事实，即从 i 向 fc < i 转移是不可能的， 
以及到达 A ： > i 的时刻是在 i，i + 1, • • • , - 1上的 fc 个独立的逗留时间 之和. 
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设⑴表示由 (8.4) 所定义的过程的转移概率.我们来证明下述重要结果，这 
个结果曾在第1卷 17.4 节中用其他方法导出过. 

引理 如果 

5^1 /Cn = oo , (8.5) 

那么对于所有的 i 和《>0， 

£^(«) = 1- (8.6) 

»=< , 

否則 (8.6) 对所有的 i 部不成立. 

证注意 A r * = 1 - p k , 从而 

A [ i 7«( A ) + ••• + fl<,i+n(A)] = 1- Pi •■- Pi + n - (8.7) 

于是为使 (8.6) 成立，当且仅当对于所有的 A > 0， 

PiPi+l ' "Pn ~*0, n — » oo . (8.8) 

如果 c „ — oo , 那 么知〜 e - V «=», 从而在这种情形下 （8.5) 是 (8.8) 的充要条件.另 
一方面，如果 c „ 不趋于无穷，那么存在一个数 4 < 1,使得对于无穷多个 n , p „ < q , 
因此 （8.8) 和 (8.5) 成立. ► 

在 (8.5) 中的级数是发散的情形下，没有什么意外的事： c „ 唯一地确定这样一 
个纯生过程，使得此过程满足作为我们的出发点的基本公设.因此，今后我们假设 
ECn 1 <°0- 

亏鼉1 - 是系统在时刻 t 前通过所有状态或到达 •边界 oo ” 的概率. 

到达时刻是在 + …上逗留的时间之和.这个级数以概韦1收敛，因为平均逗 
留时间 l / c „ 之和收敛. 

在一个从 i 开始的过程中， 过程的寿命(直到到达 oo 的时刻）的拉普拉斯变換 
为 


PiPi+l - - • Pi + n , 

(8-9) 

且心 满足方程 （7.19), 即 


(A + Cj)^i = 

(8.10) 

对于行和，我们从 (8.7) 得到 


=1 - $<. 

(8.11) 
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例 （ b ) 回返过程. 从过程 (8.4) 开始，可按如下方法定义新的过程.选择数 ft , 使 
得 ft > 0, E * = 1. 我们假定当到达 oo 时，系统的状态以 概年① * 立即转移到 i . 
于是原来的过程重新开始，直到第2次到达 oo 时 为止. 在两次到达 oo 之间经过的 
时间是一个拉普拉斯变换为 

= 名 (8.12) 

的随机变 M . 过程的马尔可夫特征要求，在第2次到达 oo 时过程以同样的方式 
重新开始.我们现在用转移概率的拉普拉斯变换 nr ^( x ) 来描述新过程的转移概率 
P ^( t ). 一个从时刻0的 i 到时刻 t 的 a ： 而中间不经过 oo 的转移的概率的变换为 
(8.4). 因此，在恰好经过 oo —次后到达*:的概率的拉普拉斯变换为& 5^ qjn jk ( X ), 
第2次到达 oo 的时刻的变换为 & t ( A ). 如果考虑更多次的回返，那么由上述方法 
可以看出，我们一定有 

= n ik w + 办巧 * W ， (8-13) 

其中 [ l - r ( A )]- 1 = E ^ n ( A ) 表示通过 oo 的 次数. 利用 (8.11) 经过简单计算可说明 
(8.13) 中的行和等于 i / a , 从而是转移概率 P ret ( t ) 的严格随机矩阵的变换. 

容易验证， 新过種譌足向后方 《(8.1), 但不涡足向前方 *(8.2). 这是应该的， 
因为不一定存在最后一次眺跃而违反了导致向前方程的公设. 

例 （ c ) 双側纯生过程. 为了得到一个既满足向前方程又满足向后方程的过程，我 
们通过令系统的状态跑遍0, ±1, 士2,…来修改上面的纯生过程.除此之外约定仍然 
不变，诸常数4 > 0对所有的整数都有定义，并且只能从 i 转移到 i +1. 我们又假 
设 E i/Cn < 00( 现在是从一 oo 到 + oo 求和) • 

最小解也没有改变，它仍由 (8.4) 给出. 极限 

Vk = Jjl n ikW = r k pk-lPk-2Pk-3 - - - (8.14) 

存在，并且可以看作是“从时刻0的 - oo 到时刻 f 的 A : 的转移的概率 P - oo , fc ⑷”的 
变换. 从这一起点出发，过程将跑遍从 - oo 到 oo 的所有状态，并且在拉普拉斯变 
换为 5-00 = 的时刻上 -到达 OO ” . 我们现在按如下方法定义一个新过程. 

它开始时是一个相应于最小解 (8.4) 的过程，但是在到达 oo 时它从 - oo 重新开始， 
过程就这样永远地继续下去.根据例 （ b ) 中所用过的构造法，对于转移概率我们有 

n ^{ X ) = n ik { X ) + T ^~. (8.15) 

①令！；《< < 1可得到回返过程的变形 I 在 H 达 oo 上时，过程以概率 i -£ qi 终止. 



14.9 遍历极限与首次通过时间的计算 437 


容易验证， 满足向前方程 (8.2) 和向后方程 (8.1). 这个过程满足导致向后方程的 
假设，但不满足导致向前方程的假设. 

14.9 遍历极限与首次通过时间的计算 

正如我们所期望的那样，整数上的马尔可夫过程的转移概率 Pij { t ) 当 t — oo 
时的性质类似于离散马尔可夫链中高阶转移概率的性质，但不会出现像周期链那 
样的麻烦 事了. 作为第1卷第15章的遍历定理的简单推论，定理1证实了这个事 
实.于是我们所关心的主要事情是计算 14.7 节的一般过程的极限，并说明怎样求 
首次通过时间.所用的方法具有广泛的适用范围. 

定理 1 假设对于随机矩阵 P ( t ) 所构成的族有 

J»(s + t ) = _ P ( S ) i »(0， （9.1) 

且当 f — 0 时 P ⑴ — 如果所有的巧 fc 舞不桠等于 0®, 那么当 f — oo 时 

Pik { t ) -* (9.2) 

其中或者对有的 fc , u fc = 0, 或者 

> 0, = 1, (9.3) 


^2 u i p jk ( t ) = u k . (9.4) 

当对于某个 f >0 存在一个满足 (9. 4 ) 的概牟向量 ( Ul ,« 2 , …)时，第 2 种情况发生.在 
这种情形下， （9.4) 对所有的纟 > 0 成立，概牟向量 ii 是唯一的. 

(正如在第1卷 17.6 节中所说明的那样，重要的特点是这些极限不依赖于 i , 这 
说明初始条件的影响是渐近可忽略的 .） 

证对于固定的«>0,考虑一个矩阵为 P (6), 髙阶转移概率为 P n ( S ) = P ( n <5) 的 
离散马尔可 夫链. 如果所有的元素 P <) t ( n <5) 是最终为正的，那么这个链是不可约的 
且是非周 期的. 根据第1卷 15.7 节的遍历定理，这个断言对局限于数例 6,26,3 S , - - 
的 f 是正解的.因为2个有理数有无穷多个公倍数，所以当 rt — 00 时 P ik ( nS ) 的极 
限对所有的有理数 <5都是相 同的. 为了完成证明，只需证明⑷是 t 的一致连续 
函数，并且对于较大的 f 是正的就 行了. 根据 (9.1), 

PiMPikit ) < P ik (a + t )$ P ik { t ) + [1 - P «( s )] (9.5) 

①引入这个条件只是为了避免这样的不足道的情形， 使得局 限于适当的状态集合就能防止这些情形. 
不难看出，这个条件蕴含 P ik ( t ) 对所有的 t 的严格正性. 
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[第1个不等式是显然的，第2个不等式可由下列事实 推出： 满足:/ / i 的诸项 
Pi ： (s) 加起来的总和为1 - P «(«) J . 对于充分小的 s , 我们有1 - e $ P^) < 1,从 
而 （9.5) 说明了 忍 的一致连续性.由 (9.5) 也推出，如果 P ^( t ) > 0, 那么 在某个 
具有固定长度的 s 区间内 P ik (t + s )>0, 从而仏或者恒等于0或者最终为正的. 


我们现在把这个结果应用于 14.7 节的最小解，假设它是严格随机的，从而是 
唯一的.利用矩阵记号， （9.4) 可写作 uP(t) = «,对于相应的普通拉普拉斯变换， 
这蕴含 

uXU ( A ) = n . (9.6) 

如果对于某个特殊值 A > 0,向* u 满足 （9.6), 那么预解方程 (7.15) 保证 （9.6) 对 
于所有的 A > 0都成立，从而保证 (9.4) 对于所有的 t > 0都成立.把 (9.6) 应用于 
向前方程 (7.6), 我们得到 

ucp = uc ; (9.7) 

分量叫 C * 是有限的，但可能是无 界的. 另一方面，如果 U 是一个满足 (9.7) 的概 
率向氪那么根据归纳法可由 (7.12) 推出，对于所有的 n , uAJI ( n )( A ) ^ «,从而 
iiAH ( A ) < «. 但是由于矩阵 AiT ( A ) 是严格随机的，所以两边的分董之和一定相 
等，从而 (9.6) 成立. 于是我们有 

定理 2 如果最小解是严格随机的（从而是唯一的），那么关系式 （9.2) 对于 u fc >0 
成立，当且仅当存在一概芈向量 u , 使 （9.7) 成立. 

特别地，这籩含 (9.7) 的解《是唯一的. 

概串解释为了使概念确定起见，我们考虑最简单的情形，即转移概率为的离 
散链是遍历的 情形. 换句话说，我们假设存在一个严格正概率向 M a = ( a 1>a2 ,...), 
使得 ap = a, 且当 n -» oo 时， — ct fc . 于是显然可知，如果 = X) Q fc c fc 1 < °°) 
那么分夤为的板率向量满足 (9.7), 而当 a = oo 时，解不存在. 

于是直观上很明显，我们的过程中的转移与矩阵为 P 的离散马尔可夫链中的 
转移是一样的，但是它们的时间是不同的.为了确定起见，我们考虑一个特殊状态 
并把它标以指标0.在0处的逐次逗留时间与离开的时间相互交替，在离开的时间 
内系统处于诸状态 j > 0. 逗留于状态的次数由 P 所控制，它们的持续时间依赖 
于勺.在离散马尔可夫链中 j 与0的频率之比是 aj / ao , 从而 aj / ao 是在一个离开 
时间区间内逗留于 j 的期望次数.由于每次逗留的期望持续时间是1/勺，所以我们 
断言,从长远来看，状态 j 与0的概率之比为 ajcJ 1 : 或 u 厂 u 0 . 

即使在⑴ — 0的情形下也可以使这个论证成为严 格的. 按照第1卷 15.11 
节提到的德曼 （ C . Derman ) 定理，如果 P 导出一个不可约的常返链，那么存在一 
个向量 a , 使得 aP = a ，并且 a 是唯一的（除了一个乘法常数夕卜).这里> 0, 
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但是级数 E 叫 可能发散.即使在这种情形下 ， ttaj ： ao 也可用上述的相对频率 
来解释，并且上述论证一般来讲也成立.如果 < oo , 那么 (9.2) 〜 (9.4) 对于 
与 ttfcCf 1 成比例的叫成立，否則当 * — oo 时 _ P ( t ) - 0. 有趣的是，极限叫可以是正 
的，即使离散链只有零状态. 

极限 Pik ( oo ) 的存在性也可以利用与循环时间有密切关系的更新论证来得到. 
为了说明怎样计算循环时间和首次通过时间的分布，我们给状态编上号码0, 1， 
2, • ■ 并把0作为主状态.我们考虑一个新过程，此过程在首次到达0的随机时 
刻以前与原来过程重合，但以后永远固定在0状 态上. 换句话说，新过程是通过在 
旧过程中取0为吸收状态得到的.用 ° P ifc ( t ) 表示修改了的过程的转移概率.于是 
° Poo ( t ) = 1 • 用原来的过程来说， Mio (纟）是从 i # 0出发在时刻 < 之前首次遑过0 
的概率， ° Pik ( t ) 给出一个从 i / 0向 fc # 0而中间不通过0的转移的概率.从概率 
上看很明显，矩阵 ° P ( t ) 应该与 P ( t ) 满足相同的向后方程和向前方程，所不同的 
是要把 co 换成 0. 我们照相反的方向 进行： 我们通过把 co 变成0来修改向后方程 
和向前方程，并证明这个吸收状态过程的难一解具有预期的性质. 

如果€是由 n (\) 的第0列组成的向 M , 那么向后方程说明向 M 


(A + c - cP )^ = ” 


(9.8) 


的 分董为 1，0,0,…•于是 ° H ( A ) 的向后方程可通过把 co 换成0而得到，从而如果$ 
表示 0 iT ( A ) 的第0列，那么向童 （9.8) 的分 M m = % =…= 0,但是= p / 0•由 
此推出分撤为 ilfco ( A )- p °77 fc 0 ( A ) 的向童满足带有》? = 0的（9.8)，因为入 71( 入） 
是严格随机的，这菹含对 所有的 = 0(12.7 节定理 3). 因为 Oflbo ( A ) = 1/ A , 所 
以对 k ^0 , 我们有 

ff * o ( A ) = A 0 i 7 fco ( A ) Ax )( A ). (9.9) 


借助于 (9.8) 中的第一个方程，我们还可看出 

^ oo ( A ) =入二勿 + 久:你 y ^ PojA ° i 7 jo ( A )/7 oo ( A ). (9.10) 

(9.9) 和 (9.10) 是有明显概率解释的史析方程.事实上，设过程从 * > 0开始.于 
是 ° n k 0 是在时刻 t 之前首次到达0的概率 0 Pfeo ( t ) 的普通拉普拉斯变换，从而 
A °77* o ( A ) 是首次到达0的时刻的分布 A 的拉普拉斯变换.于是 （9.9) 说明巧 0 ( t ) 
是巧与 Poo 的 卷积； 为使事件 X ( t ) = 0 发生，当且仅当首次到达0发生在某个时 
刻 ; r < i , 并且在 f - rr 个单位时间后系统又处在 0. 

类似地， 2 poiA °/7 j 0 表示一个离开时间的分布 F 0 , 即连续两次在0上逗留的时 
间间隔.因此， (9.10) 的右边 /7 oo ( A ) 的因子为(如果系统最初处于 0) 首次返回0所 
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需要的等待时间.（这也就是一个完全周期的分布，一个完全周期=逗留时间加上 
离开时间 .） 更新方程 （9.10) 把 Poo ⑴表示为在0上逗留的时间超过*的概率与 
在时刻 rr < t 首次返回后 X ⑴= 0的概率之和.如果0是常返的，那么根据更新定 
理， (9.10) 蕴含 

Poo(0 ° ) = r ^， _) 

其中 M 是离开时间的平均持续时间，6 1 是一个完全周期的平均持续时间. 

14.10 习 题 

1. 在更新方程 （1.3) 中，令 = = e -* t - Vr ( p ), 于是 

利用部分分式方法证明，对于整数®?, 

w W=s£ 0fce " <1 ~°* )t > (10.2) 

P fc=0 

其中 a fc = e _ i a «*/ M a = - l . 

2- 即将到达一个服务员那里的頋客流构成一个参败为《的泊松过程，每个顾客所需要的 
服务时间的分布 G 的拉普拉斯变换为7•设《⑴是一个顾客所需要的眼务时间不超 
过 t 且在这个期间内没有新顾客到达的概率.证明 ， H 是一个拉普拉斯-斯蒂尔切斯 
变换为 7 (A + a ) 的亏损分布. 

3. 失去的顾客.假设上例中的脤务员在时刻0是空闲的.用 t /( t ) 表示直到时刻 t 所有到 
达的顾客部看到服务员为空闲的概率.推导1/的更新方程，并证明17的普通拉普拉斯 
变换 w 满足线性方程 

’ = 土 + O a) + a ) w ( A ). 

为等待在一忙期中到达的第一个顾客所需的平均时间是 
a- 1 +a~ l [l->y{a))- 1 . 

提示， 利用上题. 

4- (续)利用 6.13 节的习题 I 7 所述的方法，把 U 看作是延迟了的可终止更新过程总寿命 
的分布来解上题. 

①当 p = n 和 p = r »/2 时，分母的根是相同的.但是解是完全不同的.这说明当岭是无理困败时， 
流行的•■按照分母的根进行的展开-需要谨慎. 
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5. 如果尸的期望为 A 方差为并且叫< 1,那么忙期方程 (4.1) 的解的方差为 
( o 3 + c^ 3 )/(l - eft ). 

6 •在 14.4 节例 （ b ) 中被廷迟的汽车总数的母函败是其中 

妒 ( a ) = aip ( c - c 0( s )). (10.3) 

7. 证明： 如果 p 是一正常分布的拉普拉斯变换，那么 (10.3) 的解是一个可能为亏损 
的分布的母函数.为使后者是正常分布，当且仅当 F 的期望< 1/ c . 

8. 在 14.5 节例⑷的 吸收壁 过程中，用 F ( t , x ) 表示（从 x 开始）吸收将在时间 t 内发 
生的 概率 .（于是 F 表示过程总寿命的分布 .） 证明： 1 - F 的普通拉普拉斯变换为 
K ^{ x , y ) 在0 < » < oo 上的 积分. 证明 ■ f 的拉普拉斯-斯蒂尔切斯变换为 

这和它必须满足微分方程 （5.9) 这个事实相符合. 

9. 从 (5.7) 出发来证明 I 在任一区间上的一般扩 敗方程 (5.19) 的格林函数-定具有形式 



其中心和取分别是齐次方程 

- bip ' = 0 


(*) 


的在左边界上有界和在右边界上有界的解.如果 （•） 没有有界解，那么除一乘法常数 
处 ， 和似是确定的，且乘法常数可以被吸引到 W 中.（否则必须加上适当的边界条 
件 •） 

证明 | 为使由 （10.4) 和 （5.5) 确定的叫满足微分方程 (5.19), 当且仅当灰是朗斯基 
( WronBky ) 行列式 

^(») = K 1( W )*7 a ( V ) - ? A (») f ? i (»)] a /2. (10.5) 

解匕和似一定是单调的，从而= 0. 

10. (续)对于 x < y ,) kx 出发首次通过 y 的时刻的拉普拉斯变换为 Ux )/ Mv )- 对 * > V , 
变换为 V\(x)/V\(y)- 

11. 证明 ： 14.5 节中对扩散过程所述的方法同样适用于一般的生 灭过程 .® 

12. 修改 M .6 节例 （ a ), 使之适用于 a > 1个服务员的 情形. （明确地计算出那 a 个常数是 
很麻烦的，所以不建议读者这样做 .） 

13. 在 14.6 节例 （ b ) 中由微分方程直接 证明： 忙期的期望为方差为 ^7^3. 

14. 半马尔可夫过 ®1, 2,…上的半马尔可夫过程与马尔可夫过程的不同之处，在于逗留时 
间可以依赖于终点状态 | 假定在时刻 t 进入状态 i , 由于跳到 fc 而使逗留时间在 r + t 
前结束的概率是巧*⑴.那么 E * Fik ( t ) 是逗留时间的分布,阳= F ik ( oo ) 是跳到* r 的 

①关于 ffl 节和边界条件见 W. FteUer, The birth and death process as diffusion process, Journal 
Math6matiques ptires Appliqu4es, vol. 38 (1959) pp. 301-345 . 
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概率•用 Pik(t) 表示已知在时刻 t 进入状态 i 时，在时刻 t + r 处于 fe 的概率.推导一 
个类似于科尔莫戈罗夫向后方程的方程.利用不言自明的记号，变换了的形式为 
n(A) = 7(A)+#(A)IT(A), 

其中 7(A) 是元素为 [1 - Ek ¥>«(A)]/A 的对角矩阵.对于 F ik (t) = P ik (l - e-^), 这化 
成向后方程 (7.5). 14.7 节最小解的构造仍然有效.① 


①关于細节见 W. Feller, On aemx-Markov processes, Proc. National Acad, of Sciences, vol. 
51 (1964) pp. 663-659. 半马尔可夫过程是 P. 列维和史密斯 （W. L. Smith) 引进的 • 毕克 （R. 
Pyke) 作了进一步的研究. 



第 15 章特征函数 

本章讨论特征函数的基本理论，它与第6、7、9 〜 14章完全独立.严密的傅里叶 
分析推迟到第19章再讨论. 


15.1 定义，基本性质 

非负整值随机变童 X 的母函数是定义在0 < a < 1上的函数 Eh *) (即的 
期 望). 正如在第 13 章中所说明的那样，只要利用变最替换 S = 我们在研究任 

意非负随机变 M 时，也可以使用上述有用的 工具. 这些变换的用处多半来自于乘法 
性质#+» = 〆 #和 e _ M *+ v > = e -^ e -^. 具有纯虚自变撤的指数函数，即对于实 
数 a : ,由 

e ^ 1 = coeC * + isinCa : ( 1 . 1 ) 

(其中 < 是一实常数， i 2 = -1) 所定义的函数也具有这个性质.因为这个函数是有界 
的，所以在任何情况下它的期望都存在.用 E ( e ^。 代替母函数可以提供一个强有 
力的普遍适用的工具，但它是以引进复值函数和复值变量为代价而获得的.只是应 
注意到那些独立随机变 M 仍然局限于实直线（或者以后局限于 R ). 

所谓复值函数 u » = u + iu , 指的是对 实数； r 定义的实函数对 u 和 w •期望 E ( w ) 
是 E ⑻ + iE ⑷的 缩写. 我们照例把共轭函数记作 i 2 J = u - i «, 把绝对值记作 M (即 
| u ,|2 = wW = u 2 + v 2 ^ 期望的基本性质仍然成立，只是 中值定 理需要 说明： 如果 
| w | < a 那么 | E («.)| ^ a . 事实上，根据施瓦兹不等式， 

| E («;)| 2 = ( E («)) 2 + ( E ( w )) a 《 E ( u 3 ) + E ( V a ) = E (| W | a ) < o 2 . (1.2) 

当且仅当对偶 (£/ i , Vi ) 与对偶 ( f / 2 , V 2 ) 是相互独立时，称两个复值随机变景 HO = 
Uj + iVj 是独 立的. 把复数分解为实部和虚部，就可看出乘法性质 E ( W ^ W 2 ) = 
E ( m ) E ( W ^) 仍然成立.（这个公式说明了复数符号的优点 •) 有了这些预备知识，我 
们就可以按下列方式定义一个与母函数类似的概念. 

定义设 X 是一个概牟分布为尸的随机 变量. F (或 X )的特征函数是气实数 < 由 

冰 )= 乂 : e^ x F{dx} = u(0 + iv(0 ( 1 . 3 ) 
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定义的函數 A 其中 

u(C) = f cob^x • F{di}, v(Q = f sin ■ F { ix }. (1.4) 

J —oo J —oo 

对于具有密度 / 的分布 F, 自然有 

¥>«) = J " j Kx f { x ) dx . (1.5) 

术语解释在普遍采用的傅里叶分析术语中， < P 是 F 的傅里叶-斯蒂尔切斯 
(Fourier-Stieltjes) 变换.这样的变换是对所有有界测度定义的，术语“特征函数”强 
调测度具有单位质 M. (其他的测度不具有特征函数 .） 另一方面，形如 (1.5) 的积 
分出现在许多方面，我们认为 (1.5) 确定了 /的普通傅里叶变換.（当,/存在时) F 
的特征函数是密度/的普通傅里叶变换，但是术语傅里叶变换也适用于其他函数. 

► 

为了便于引用起见，我们列举特征函数的一些基本性质. 

引理1 设 v> = u + iw 是一个分布为 F 的随机变量X的特征函數，則 

(a) ¥>是连埭的； 

(b) v>(0) = 1,并且对于所有的 C.W0K1； 

(c) + & 的特征*数为 

E( e i<(ax+fc)) = e iK 咖 ) • (1.6) 

特别 ， Ip = u - iv 支 — X 的特征 A 數. 

(d) u 是偶函数，V是奇函數.为使特征函数是实值的.当且仅当 F 是对称的. 

(e) 对于所有的<， 

0^1-«(2CK4(l-u(O). (1.7) 

(关于变形见习题1 〜习题 3 . ) 

证⑷注意到= 1,从而 

| e iC(*+h) _ ei<*| = | e iCh _ !|. (1.8) 

右边与 * 无关，且对于充分接近于0的 h, 它是任意小的.于是 p 实际上是一致连 
续的. 由中值定理可知，性质 （b) 是显然的 .（c) 不需要加以 说明. 为了证明⑷，我 
们提前使用下面的事实：不同的分布有不同的特征函数.于是为使是实的，当且 
仅当沪=尹，即X和 -X 有相同的特征 函数. 但是，这样X和 -X 有相同的分布， 
从而 F 是对称的.最后为了证明 （e), 考虑初等的三角关系式 

1 — cos2^x = 2(1 — cos 2 <i) 彡 4(1 _ co8(:c). (1.9) 
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它是成立的，因为0<1 + €08以彡2.取期望我们就得到 (1.7). ► 

现在考虑两个分布为 Fi , F 2 , 特征函数为仍,仍的随机变量 X U X 2 . 如果 
和 X 2 是独立的，那么指数函数的乘法性质保证了 

E ( e i<(Xi+x ? )j = E(e iCX, )E(e iCXa ). (1.10) 

这个偷单的结果经常被用到，因此我们把它写作 
引理 2 卷枳 F \ irF 2 的特征函教为 仍仍. 

换句话说，两个独立随机变釐之和+ X 2 对应于它们的特征函数的乘积 

¥>i¥>2-® 

如果為的分布和 A 的分布相同，那么和 Xx - X 2 表示一个对称变贵（见 5.5 
节).因此我们有 

系|刮 2 是对称分布 1 'F 的特征函教. 

下列引理刻划了算术分布的特征. 

引理3 如果那么下列 3个陈迷是等 价的： 

(a) v?(A) = 1; 

(b) 有周期 A, 即对于所有的 （ 和 n，¥>(C + nA) = ¥»(C); 

(c) F 的所有的增 点郗在 0, 士 & ±2 h , …上，其中 /i = 2 n / X . 

证如果 （ c) 是正确的，并且 F 对 n/» 賦予重 Mp„ ，那么 

MC ) = Sp„e inh <. 

这个函数有周期 2n/A, 从而 （c) 蘊含 （b), 而⑼又比 ⑷强. 

反之，如果 （a) 成立，那么非负函数1 - coeAx 的期望等于0,只有当在 P 的 
每个增点 a： 上都有1 - coeAx = 0时上述结论才可能成立.于是 F 集中于2>1/入的 
倍数上，从而 （c) 成立. > 

这个引理包含了集中于原点上的分布 F 这一极端 情形. 于是对于所有的 CM 0 
=1,从而每个数都是#的 周期. 一般说来，如果 A 是 p 的周期，那么所有的倍数 
±A,±2A, ••也 是屮的周期，但是对于非常数周期函数¥>,存在一个最小正周期，这 
称为真周期.类似地，对于算术分布 F, 存在一个使性质 （c) 成立的最大的正的/», 
这称为 F 的步长.由引理3推知，步长 A 和周期 入通过 A/t = 2 it 相联系.于是除 
非对于所有的 C 兴 0, V (O # 1,或者屮 (C) = 1,否则就存在一个最小的 A > 0,使得 
V(A) = 1, m^0<C< A,v»(C)^l. 

所有这些结果可以用更一般的形式叙述.代替 v>(A) = 1,只假设 |^(A)| = 1, 
于是存在一个实数6,使得 p(A) = e iW , 我们可以把上述结果应用于特征函数为 

①其逆是错误的，因为在 2.4 节 （e) 和 3.9 节的习题1中巳证明，在某些特殊情形下，2个相关变量 
之和可以有分布 Fi - kFa , 从而有特征函数 奶 外. 
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< p ( C )^ lbX 的变童 X _ b , 此特征函数在 C A 时等于 1. 这个特征函数的每个周期 
自然是 M 的周期，于是我们证明了 
引理4 只 有下列 3 种可 能性： 

( a ) 对于所有的 C #0,| vKA )|< l . 

( b ) | v ?( A )| = 1, 且对于 0 < < < A ,|¥>( C )| < 1. 在这种情形下， M 有周期 A , 并 
且存在一个实数 b , 使得 F ( a : + 6) 是步长为 /i = 2 nA \ 的算术分布. 

( c ) 对于所有的 C ， k ( C)l = l . 在这种情形下， vKC )= e^,F 集中于点 6 上. 

例 设 F 集中于0和1上，并对每点賦予概率 I . 于是 F 是步长为1的算术分 
布，它的特征函数 ¥>(0 = (l + e iC )/2 的周期是如.分布 F^x + i ) 集中于±4上， 
它的步长为^它的特征函数 cosC /2 的周期为 4 ji . ► 

15.2 特殊的分布，混合 

为了便丁-参考引用起见，我们给出10个常用密度的特征函数表，并叙述推导 
它们的方法. 

关于表 1的注 （1) 正态密度.如果我们不怕复杂的积分，那么根据代换 y = X-K, 
这个结果是显然的，为了在实数域上证明此分式，利用微分和分部积分证明 魏、= 
-0(0 .因为 ¥>(0) = 1,所以 lnv ( C ) = -\< 2 , 这与断言相同. 

(2) 和 （3) 均匀分布 . （ 2 )和 （3) 中的计算是显然的，2个分布的不同之处只是 
位置 参数，特征函数之间的关系式说明了法则 (1.6). 

(4) 三角形分布. 利用分部积分作直接计算是很容易的，另外，注意到我们的 
三角形密度是在 - \ a < x<\a 上的均匀密度与其本身的卷积并考虑到 （3), 可知 

它的特征函数是 • 

(5) 这是通过把反演公式 (3.5) 应用于三角形密度 （4) 而得到的，又见习题 4. 
这个公式具有重大的意义，因为许多傅里叶分析证明依赖于利用一个在有限区间 
外等于0的特征函数. 

(6) r 密度.利用代换 y = x {\- K ). 如果有人仍喜欢在实数域中进行讨论，那 
么可把 ek 展为幂级数.关于特征函数，我们用这种方法得到 

点 g 誓= |織《)" = „§0)". 

这是实际上 (1- iC )-* 的二项级数，对于特殊情形 t = 1( 指数分布)，计算可以通过 
重复利用分部积分公式来进行.利用递推方法可知，当 t 为整数时/这都是正确的. 
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(7) 双側指数分布可通过指数分布的对称化获得，从而特征函数可由 f = 1的 
(6.1) 推出.重复利用分部积分公式，直接验证是不难的. 

(8) 村西分布.这个公式也可以利用反演公式 (3.5) 由上一公式推出.这个公式 
的直接验证是留数计算中的一个标准练习. 

⑼贝塞尔密度.这是在 13.3 节例⑷中导出的拉普拉斯变换的傅里叶形式， 
可以用同样的方法证明. 

(10) 双曲余弦 分布. 相应的分布函数是 F{x) = 1 - Zi^arctane-* •表15~1第 
10号的公式不很重要，但是因为它给出了一个“自反对偶”，密度和它的特 征函数 
的不同之处仅在丁-尺度参数，而有一定价值.（正态分布是这种现象的最好例子 •） 
为了计算特征函数，把密度展成几何级数 

去 5>1)V ( 糾 ) K 


序号 

名称 

密度 

区间 

特征函数 

1 

m 态分布 


—OO < X < oo 

e-i< 2 

2 

均匀分布 

1 

0<x<a 

e'*C - 1 

3 

均匀分布 

1 

2^ 

|*| < a 


4 

三角形分布 

K 1_i r) 

|:| < a 

„l-cosoC 

o*C a 

5 


n ax 3 

—oo < as < oo 

f l-^,|C|<o 

1 o |C|>o 

6 

r 分布 


* > 0, t > 0 

1 

(1-iO 1 

7 

双侧抱数分布 


—oo < z < oo 

l + C 2 


柯西分布 
贝塞尔分布 
双曲余弦分布 ® 




[l-iC-N/O-iO 4 -!!' 


把表 15>1 第 7 号的密度用于每一项，我们就得到特征函数的典型部分分式展开式. 
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(关于进一步的例子，见习题5 〜 习题 8.) 

回到一般理论，我们给出一个从已知特征函数构造新特征函数的 方法. 原理是 
极简单的，但是例 （ b ) 说明它可以用来避免冗长的计算. 

引理 设凡，朽 ，…是 特征 A 数为仰 ，灼，…的概牟 分布. 

如果 Pfc > 0 且 Epjt = 1 ，那么混合 


u = y^pfcFfc 


( 2 . 1 ) 


是一个 特征* 數为 


w = ^Pk^fc (2.2) 

的概芈分布. 

例 （ a ) 随机和 ■设…是具有共同分布 F 和特征函数#的独立随机变 量. 
设 7 V 是一个母函数为/ >( S ) = Y . Pk 8 k 的整值随机变 M , 并且与 X , 独立. 那么随机 
和不+…+ 有分布 （2.1)( 其中凡 = F ^), 相应的特征函数是 


w ( C ) = P (^(0). (2.3) 

最值得注意的情形是复 合泊松 分布的情形.此处 p ^ e -^/ A !. 并且 


w ( C ) = e - t+ 〜(。. 

普通的泊松分布表示 F 集中于点1上即 y >( C ) = 时的特殊情形, 

例 （ b ) 凸多 边形. 我们从表15>1第5号知道 


沪(0 : 




-ICI, ICI^I 
ICI>1 


是一个特征函数.如果的,…,〜是任意正数，那么混合 


(2-4) 


(2-5) 


w ( C ) = Pl¥> (盖)+ …+ (盖) (2.6) 

是一个偶特征函数，它在 W 上的图形是一个凸多边形（见图 1&-1). 事实上，不 
失一般性，设 a ! <句 < … < o „. 在区间0 < C <勿上， w 的图形是一条斜 
率为一(尝 + ••• + £) 的直 线段. 在 《» i 和勿之间项 w / ai 消失了，等等•一 
直到在 an - i 和 On 之间图形与一条斜率为 - Pn/an 的直线段重合为止.因此，在 
0^上图形是由 n 条具有递减斜率的线段和 C 轴上的线段 a ^7 oo 组成的多边形. 
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容易看出，每个具有这种性质的多边形可以用 (2.6) 表示 （71 条边与 w 轴相 交于点 
Pn,Pn + Pn-U - ■ ■ ,Pn + ■ ■ • + Pi = 1) -我们断言，每个满足 W ⑼ = 1 且在 0, 00 上的 
困形是凸多边形的偶兩教 W > 0是一个特征函數. 

简单的取极限将导致著名的波利亚准则 [15.3 节例 （ b )] 并且揭示了它的自然来 
源.即使现在这个特殊的准则也可导致意想不到的值得注意的结果. 



一些意外的现象 

我们稍微离开主题，引入-些具有意外的有趣的性质的特殊类型特征函数.我们从一 
个关于算术分布的预备性陈述开始. 

假设分布 G 集中于某个固定败 n/L > 0 的倍数 n«/L 上，点 rut / L 的概率为此处 
n = 0 , ± 1 , • ■ •. 特征函败 7 为， 

7(0= Y, P" elnK</ ' (2.7) 


并且具有周期 2 L . 通常不容易求出7的明显表达式，反而容易用特征函败7来表示概率 
Pr . 实际上，用 e — M / 1 ■乘以 （2.7) •概率办作为周期函数的系数出现，除 n = r 
外，此函数在上的积分等于 0. 由此推出 

^ = f_ L rr ^ TK<，Ld ^ = - - ( 2 . 8 ) 

我们现在提前使用 19.4 节中定理1的下列准则 ： 设 7 是一个周期为 L> 0 的连续函 
数，并且被正规化 7(0) = 1. 那么，7是一个特征函數，当且仅当 (2.8) 中所有的数 p r > 0.在 
这种情形下， { Pr } 自然是一个概率分布，且 （2.7) 成立. 
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例 （ c ) 选取一^任意的1,设 7 是一个周期为 2L 的函数，当|<| < L 时此函数与 
(2.5) 的特征函数#重合.那么，7是一个集中于 n / L 的倍数上的算术分布的 特征* 数.事 
实上，由对称性， (2.8) 化为 

Pr= X Jo 7 (() 008 = J ； J (! ~0 coerreC / LdC . (2.9) 

通过简单的分部积分，可证明 

po = 1/(2L), pr = L* 2 (l — cosm/L) > 0 r / 0. (2.10) 

于是我们得到了一整族周期特征*数，它们的困形由一个底边为 2» iL-l OrKlML + l 的 
直角三角形的周期性 t ■复及 C 轴在它们中间的部分组成（见图(我们将在 19.5 节中 
在泊松求和公式这个更一般的背景下再来讨论这个例子 •） 

.八. 八八. 

-i -I 0 t I U U AL 
图 H 2 例 （ c ) 的图解 


奇特性质⑴两个不同的特征*敦可以在有限区间二57内重合.例 （b) 或例 （c) 的这 
个明显推论说明了特征函数和母函数（或拉 t 拉斯变换）之间的明显差别. 

(U) 3个板芈分布之间的关系式 F - kF , = F - kF , 并不疏合 15 ^ = 丹 实际上，对于由 
(2.5) 定义的 a 以及任意2个在区间内里合的特征函败，我们有= 州. 特别， 
对于例 （c) 的每个周期特征函败，我们有=們. 

(Ui) 更出乎意料的是存在两个实的特征南數列使得处处有 | 外 | = Vi >0. 事实上，考 
虑具有 L = 1的例 （c} 中的特征函数 T 它的图形由图15>3的实折线表示.我们看到，相应 
的分布对原点賦予重 * 1/2. 消去这个原子并使其他原子的质量加倍，躭得到特征函数为 
27 - 1的分布.它的图形 


V 



图1卜3奇特性质 （iii) 的图解 


①统计学家和天文学家有时提问，给定的分布是否有正态分*.这个问《是有意义的，因为正态分布 
Wa 的特征函败没有零点，因此 niirF ! = n ,- kF 2 蓮含 ¥>1 = V >2, 从而根据唯一性定理，籤含 
F!=Ft. 
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由在±1间振动的斜率为±2的折线给出.由此推出，2 7 - 1是一个特征函数，其图 

形可通过在7的图形中每隔一个三角形把一个三角形沿着 C 轴反射而得到（图 15^3) .因 
此，和27 _ 1是2个实的特征函数，它们只是符号有所不同_ (关于图15>2的类 

似构造，见习题 9.) 


15.3 唯 一性， 反演公式 


设 F 和 G 是两个特征函数为和7的分布，于是 

e-^VCC) = J + °° e l ^ x - l) F{dx}. (3.1) 

关于 G{dC} 积分，我们得到 

厂 e-'^CMdC} = l(x- t)F{dx}. (3.2) 

J—oo J—oo 

这个恒等式通称为帕 塞瓦尔关系式 (但是，它可以写成许多等价的形式，我们将在 
第 19 章中再来讨论). 

我们将只利用 G = %>是密度为 an(ai) 的正态分布这一特殊情形.它的特征 
函数为 7(0 = v/^n«/a), 从而 (3.2) 呈形式 

J e _i< ： V(C)an(aC)dC = J n F{di}, (3.3) 

此式和 

wJl = /二 H 宁) 响 } ( 34) 

相同. 

从这个恒等式可以得出许多结论.首先，右边是 F 与一个期望为0,方差为 a 2 
的正态分布的卷积 m a - kF 的密度.于是在原则上当 p 巳知时，我们就可对所有的 
a 计算出分布 m a itF . 但是， 01 o 的方差为 a 2 , 从而当 a — 0时 队 ★F — 兄由此 
推出， p 唯一地确定了分布 F. 因此，我们有重要的 
定理1 不同的概牟分布具有不同的特征兩數. 

假设已给出一个特征函数为的概率分布的序列，使得对于所有的 C, 
^(0- 根据 8.6 节的选择定理，存在一个序列 {n fc } 和一个可能为亏损的分 
布使得凡* — F. 我们把 (3.4) 应用于对偶 (Vn^.FnJ, 并令 fc — oo. 取极限我 
们又得到恒等式 （3.4) [左边是根据控制收敛定理，右边是由于被积函数 n (( t - x ) a ) 
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在无穷远处等于 Oj . 但是我们已经看到，对于给 定的％ 恒等式 (3.4) 唯一地确定 
了 从而极限 F 对于所有的收敛子序列 { F n ,} 来说都是相 同的. 于是我们有 

引理设&是一个特征函数为的概率分布.如果对于所有的 C , Vn (0- ^(0, 
那么存在一个可能为亏損的分布 F , 使得仏-厂 

例 （ a ) 设1/是一个具有实的非负特征函数 U ； 的概率分布.设= U n *, 因此 
M0 = w n (0- 于是除了使得 w ( C ) = 1的诸点外， v >„( C ) — 0. 根据 15.1 节的引理 
4,这个集合由 形如土 nA 的所有的点组成，其中 A > 0是一个固定的数.由此推出 
(3.4) 的左边恒等于0,从而 1/"* — 0. 根据对称化，我们断言，对于不集中于0上 
的任一概芈分布 G , G n * —0. * 

下列定理在本质上说明了，极限/='是亏损的，当且仅当极限#在原点处是不 
连续的. 

定理2 ( 连埃性定 理). 一个由概牟分布组成的序列 { F n } 正常收效于一个概芈分 

布当且仅当它们的特征函数序列处处收敛于极限 a 并且#在原点的某个邻城 
内是连续的. 

在这种情形下， p 是尸的特征函数.（因此，#是处处连埃的，并且收敛 
在每个有限区间内是一致的 .） 

证 （ a ) 假设八 — 其中 F 是一个正常概率分布.根据 8.1 节中的系，特征函 
数 Pn 收敛于 F 的特征函数 A 这个收敛在有限区间内是一致的. 

( b ) 假设对于所有的 <,^(0 - V ( C ). 根据上一引理，极限 F = limF n 存在， 
恒等式 (3.3) 可以 应用. 左边是有界函数 e -« V ( C ) 关于一个期望为0、方差为 a - 2 的 
正态分布的期望.当 a — oo 时，这个分布集中于原点附近，因此当#在原点的某 
-邻域上连续时，左边趋于 ¥>(0). 但是，因为，％⑼=1,所以我们有 W0 ) = 1,另 
—方面，对于所有的 a ;, V2jm { x ) < 1,从而右边< F {- oo ’ oo }. 于是 F {- oo , oo } >1 
因此 F 是一正常分布. ► 

系设 V 5 是一个连埃函數， { y > n } 是一列特征 A 数.如果处处有 V? n -♦ %那么 p 也 
是一个 特征* 数. 

例 （ b ) 波利亚准則.设 W 是这样一个实的偶函數，使得 W (0) = l ， 并且其困形在 
W 上是凸的，那么， W 是一个特征函數.实际上，我们在15_2节例 （ b ) 中曾看到， 
当图形是凸多边形时这个断言是正确的_因为凹曲线的内接多边形是凸的，所以一 
般断言是系的直接 推论. 这个准则（以及它的一个很复杂的证明）在早期具有意想 
不到的价值 . G . 波利亚在1920年曾利用它来证明，对0 < 是一个稳 

定分布的特征函数，（据说柯西已知道这个事实，但是没给出证明 .） 实际上即使对 
1 < a < 2, e - l « l ° 也是特征函数，但是这个准则不再适用了. ► 

我们把证明定理1时所用的方法的充分利用推迟到第19章，但是，我们在这 
里利用它来推导一个重要定理，此定理曾用于表 15*1 的第5号分布和第8号分布. 
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为了简略起见，当且仅当 M 在二上可积时，我们记 v > eL . 

定理3 (傅里叶反演).设$是分布 F 的特征禹數，并设 e 那么 F 有一个 

有界连续密度/， ^ 

/(工)=士乂二 e _^ V(OdC (3.5) 

证用 fa ( t ) 表示 (3.4) 的右边.那么，厶是 F 和期望为0方差为 a 2 的正态分布 
« n a 的卷积凡=饥。★尸的密度，正如以前所提到过的那样，这蕴含当 a — 0时 
F a ^ F . 从左边的表达式显然可见厶⑴—/⑴(有界收敛)，其中/是 (3.5) 中所 
定义的有界连续函数.于是对每个有界区间厂 

F a { I } = J ! f a ( t)dt — ji (3.6) 

但是，如果 / 是 F 的连续区间，那么最左边的项趋于 F {7}, 因此/确实是 F 的密 
度. ► 

系如果那么为使 v ? ei <, 当且仅当相应的分布尸有一个有界密度. 

证根据上一定理，#的可积性保证 F 有一个有界连续密度.反之，如果 F 有一 
个密度 f < M , 那么对 t = 0我们从 (3.4) 可得 

忐 /二 9(0 e - i aa<S dC = 士 _ /: e- lV(2oI) /(*)dx < M . (3.7) 

左边的被积函数 > 0,如果 p 是不可积的，那么当 o ->0 时此积分趋于 oa ► 

例 （ c ) 普朗谢雷尔 ( Planchrel ) 恒等式.设分布 F 有一个密度/和一个特征函数 
V >- 那么，为使 Ivf € 当且仅当/ 2 G I ,在这种情形下， 

J: f\y)dy lv(0l a dC- (3.8) 

实际上， k | 2 是对称化了的分布 0 尸的特征函数.如果 Id 2 e 那么由此推出 0 f 

的密度 x 

0 ⑽= J f(y + x ) f { y)dy (3.9) 

是有界连 续的. (3.8) 的左边等丁- °/(0),把反演公式 (3.5) 应用于 V ,可证明这对 
右边也是正确的.反之，如果尸€ 那么把施瓦兹不等式应用于 (3.9), 可证明 0 / 
是有界的，从而根据上一系有 M 2 e L . 我们将在 19.7 节中再次讨论关系式 (3.8). 
例 （ d ) 密度的连续性 定理. 设外和是可积的特征函数，使得 

^ j ¥> n ( O -^( C )| dC -*0. (3.10) 
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根据上一系，相应的分布 F „ 和 F 分别具有有界连续密度/„和/,从反演公式 
(3.5) 可看出 ^ 

l/n(*) - /(x)| $ ( 2 «) _1 乂 : IVn(C) - <p{C)\dC 

因此，一致地有/„ — /• (又见习题 12.) 

例 （ e ) 分布兩數的反演公式•设 F 是一个特征函数为 P 的分布，又设/» > 0是任 
意固定的，我们来证明，当下列被积函数可积时1例如它是 0(1/ C 2 ), 即当00 
时剛 = 0(1/0], 


F{x + h)~ F(x) 
h 



1 - e i < h | 

l_ iC^ 


r i(x dc. 


(3.11) 


实际上，左边是 F 和集中于二 U 上的均匀分布的卷积的密度；根据乘积法则，积 
分号下的因子是这个卷积的特征函数.因此， (3.11) 只不过是一般反演公式 
(3.5) 的一个特殊情形. ► 

关于所谓的反演公式的注 只有当 |y>(C)/CI 在无穷远邻域可积时公式 (3.11) 才能 
应用，但是这一公式的一个明显变形却是在一般情况下都可应用的，例如，设风 
表示 F 与方差为 a 2 的对称正态分布的卷积，于是根据 (3.11), 

■氣 士 £ (3 , 2) 


断言“如果: r 和是 F 的连续点，那么当 a 4 0时右边趋于 | F ( x + h )- F ( a :)]// i " 
是一个典型的“反演定理”.可以给出无数个等价公式，传统的形式是在 (3.12) 中把 
正态公布换为上的均匀分布并令 < — oo . 由于习惯势力的影响，这样的反演 
公式仍然是一个受欢迎的课题，虽然它们已失去其重要性：用狄利克雷 ( Dirichlet ) 
积分来推导反濟公式有损于理论的逻辑结构. 

我们从特征函数为可积的分布转向格点分布.设 F 对点 b + kh 賦予质世外， 
其中 p fc > 0且 EP * = 1- 于是特征函数屮为 

^(0 = £ p * ei(b+kh)< - (3.13) 

我们假设 h>0 

定理4 如果9是一个形如 (3.13) 的特征 兩數， 那么 

= ^ [’二 < p (0 e~ l{b+rhK dC (3.14) 

证被积函数是一个级数•在这个级数中， P * 的因子等于根据# r •或 
k = r , 它的积分等于0或因此 (3.14) 成立. ► 
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15.4 正则性 


本节的主要结果可以粗略地概述如下：分布 F 的尾部越小，它的特征函数 p 
就越光滑 •, 反之， F 越光滑， W 在无穷远处的性质就越好（引理2和引理 4). 许多 
与特征函数有关的估计依赖于用泰勒 (Taylor) 展开式的有限多项逼近所产生的 
误差的估计.下列引理说明这个误差被去掉的第1项所控制. 

引理1①对 n=l,2, …和 t >0, 



(it)"- 1 I ^ t n 
(n-l)!| 、百. 


(4.1) 


证用 Pn(t) 表示绝对值符号内的表达式，于是 

pi(t) = i J e^dx, 


(4-2) 


从而 bi(<)l < i» 此外，对 n > l, 

Pn{t) = i f p„-i(x)dx, 
Jo 


(4.3) 


于是 （4.1) 可由归纳法得到. ► 

以后 F 是一个任意的分布函数，是它的特征 函数. 关于 F 的矩和绝对矩（当 
它们存在时)，我们记 


m n = J i"F{da:}, Af„ = y (4.4) 

引理 2 如果 M „< oo , 那么 p 的 n 阶导數存在，并且由下列 连续* 數 给出， 

<p {n) (0 = i n J°° e iCx x n F{da;}. (4.5) 

证 p 的差商为 

in ((- ; h、 _ ,n(r\ r°° . — - 1 

(4.6) 


V>(C + h)~ y?(C) 
h * 


^ e iC *^^ F { dx }. 


根据上一引理，被积函数不大于 M, 因此对于 r» = 1,断言 (4.5) 可由控制收敛定 
理推出.一般情形可用归纳法推出. ► 

①同样的方法可证，当 Silrf 或 COBt 的泰勒塍开式在有限多項后停止时，误差 与去揮 的第1项同号， 
且绝对值小于这一項的绝对值.例如 • 1 — cost <t 2 /2. 
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系如果 m2 < oo , 那么 


^/ ⑼ = imi, 〆’ ⑼ = —m2. 


上一关系的逆成立：如果 V ⑼存在，那么 m2 < oo . 
证 用《表示 P 的实部，我们有 
-«(/») 


h 2 


— COBhx 

h 2 X 2 


i ^ F { Ax }. 


(4.7) 


(4.8) 


u "(0) 的存在性蕴含 u ' 在原点附近存在，并且是连续的.特别， u \0) = 0,因为 
u 是偶函数.根据中值定理，存在一个0,使得0 < 0 < 1,且 


= l 丁 I 叫 I . 


(4.9) 


当 A — 0时，右边趋于 u" ⑼. 但是， (4.8) 中积分号下的分式趋于 I ,因此当 
m 2 = oo 时积分趋近于 oo . 关于推广见习题 15. ► 

例 （ a ) —个满足少'(0) = 0的非常值函数少不可能是一个特征函数，因为相应 
的分布的二阶矩等于 0. 例如，当 a > 2时， e - KI ° 就不是特征函数. 

例 （ b ) 辟大教定律.设 X U X 2 、… 是具有共同特征函数#的独立随机变童且 
E (曷）= 0.设 S „ =不+ … + X „. 平均值 S n /n 的特征函数为泸 ( C / n ). 于是在原 
点附近 <p(h) = 1 + o (/ i ), 从而当 n -» oo 时 ip((/n) = 1 + o ( l / n ). 因此，取对数，我 
们看出 ¥> n ( C /») - 1- 于是根据 15.3 节的连续性定理2,这籩含 Sn/n 的分布趋于 
一个集中 T 原点上的分布.这就是弱大数 定律. 这个证明的简单性与直接性对特征 
函数来说是典型的，其变形将导致中心极限定理 .® 

引理3 (黎受-勒贝格)，如果 S 是可积的，并且 


7(0 = J e l < x g{x)dx, 


(4.10) 


那么当 （— ±oo 时 7(0 0- 

证容易对有限阶梯函数 S 验证这个 断言. 对任意的可积函数 S 和€ > 0,根据 4.2 
节的平均逼近定理，存在一个有限阶梯函数 Sl , 使得 

J 10 ㈤ - fli(*)|dx < c . (4.11) 

①这个论证不适用于一阶导 ft . 寻求 V ( o ) 存在的条件这个长期引人注*的问*将在 17.2 节中解决. 
® 在 7.7 节中曾证明.即使在变量 Xj 的期 B 不存在时，弱大败定律也成立.这里的证明抱出 ^(0) 
的存在性是一个充分 条件. 实际上它也是必*条件（见 17.2 节). 
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91 的变换 (4.10)71 在无穷远处等于零，由上述两个关系式，对所有的 C 我们有 
WO -7 i ( C)l < e . 因此，对于所有充分大的 ICI ， l 7 i ( C)l < 2 e , 因为 e 是任意的，所 
以当（-»±«>时 71 (0 — 0. ► 

作为一个简单的推论，我们得到 

引理4 如果 F 有密度/,那么当 C - ±oo 时 < P ( C ) — 0. 如果/ 有可积导教 
/:••，/(")，那么当 — oo 时 IvKOI = o (| c |- n ). 

证第1个断言已包含在引理3中了，如果尸是可积的，那么利用分部积分可得 
< p {0 = r ^ j ^ J Kx nx ) dx , (4.12) 

从而 WOHMCI — 1 )， 等等. ► 

附录特征函数的泰勒展开式 
不等式 (4.1) 可以改写成形式 

| 个卜 f —. -轉) 卜竽. _ 

我们由此式利用 (4.5) 可得 

| v>(C + t )- v >(0 - —’(0 - (414) 

如果 M „ < 00,那么不等式对任意的 C 和 t 成立，它给出了 与其泰勒展开式的前有限项 
之差的上界.在 F 集中于点1上这 •特 殊情形下，不等式 (4.14) 化为 (4.1). 

现在假设所有的矩都存在，并且 

limsup ~ Mn n = X < oo , (4.15) 

那么 n ! 的斯特林公式显然表明，对于 | t | < 1/(3 A ), 当《 — oo 时 (4.14) 的右边趋于0,从 
而 P 的泰勒级败在某一个包含 C 的区间内 收敛. 由此推出，在实轴上任一点的邻域内是 
解析的，从而可由它在原点附近的幂级数完全确定.但是 y "\0) = 于是 p 由 F 

的矩 m „ 完全确定.因此，如果 (4.15) 成立，那么 v 由 F 的矩难一 磅定，#在实轴上任一 
点的一个邻域内是解析的.这个唯一性准则比 7.3 节 (3.14) 所叙述的卡莱曼 （ Carleman ) 充 
分条件 EMi /n = oo 弱，但是这两个准则相差不大，（关于一个不由矩确定的分布的例子， 
见 7.3 节 .） 

15.5 关于相等分置的中心极限定理 

与中心极限定理有关的工作对概率论中现在通常使用的工具的发展和完善起 
了很大的作用，因此比较一下不同的证明将很有启发意义.直到最近 （ P . 列维首先 





利用的）特征函数方法要比林德伯格的直接方法（更不用说其他方法了）简单得多， 
后一方法的现代形式（已在 8.4 节中给出）也不怎么太复杂了，此外它还有其他优 
点.另一方面，特征函数方法可导致一些现在用直接方法还无法得到的深刻结果. 
本节的局部极限定理和将在下一章中叙述的误差估计和渐近展开就是这样的例子. 
我们把具有共同分布的变量这一特殊情形分离出来，部分地是由于它的重要性，部 
分地是为了在最简单的情况下说明这种方法的本质. 

在本节中••是具有共同分布 F 和特征函数#的相互独立的变童.我 
们假设 

E ⑷ ) = 0， E ( X ?) = 1, (5.1) 

并设 S „ = & + •••+ X „. 

定理 1® 的分布超于正态分布讥 

由 15.3 节中的连续性定理2,这个断言等价于下列 陈述： 对所有的（，当 n — oo 
时 

¥> n ( C / Vn ) (5.2) 

证根据上节的引理2, 有连续的二阶导数，从而由泰勒公式， 

p ( a :) = ¥>(0) + ar (^0) + $ xV '0) + o ( a : 2 )， i ->0. (5.3) 

取 C 为任意的数，并令 a ： = C / n ， 可得 

一 (去) =1_ ^ 2 + 。(1)， n_40 °- (5 - 4) 

取 n 次方，我们就得到 (5.2). ► 

人们自然希望，当 F 具有密度/时，5„/^的密度趋丁-正态密度 n . 这并不 
总是正确的，但是幸好例外情形是相当“病态 ”的. 下列定理包含了通常应用中出 
现的情况. 

定理2 如果 M 是可积的，那么 S n / y / K 的密度/„ 一致地超于正态密度 n . 

证傅里叶反演公式 （3.5) 对/„和 n 都成立，因此 

|/„(:卜十)|<_ 

右边是与 * 无 关的. 我们证明，当 n — oo 时，右边趋于0•由 (5.3), 可以选择这样 
的5 > 0 ,使得当 | C | < <5时， 

MOKe _iC * - (5.6) 

①方差的存在性不是 S„ 具有渐近正态性的必要条件.关于充要条件，见 18.5 节中的系 1. 
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我们现在把积分分成3部分，并证明对于充分大的每部分都< e. (1) 正如我们 
在以上证明中所看到的那样，在一个固定的区间 -a < C < a 内，被积函数一致地趋 
于0,从而在二575上的积分趋于0, (2) 对于 o < |C| < 被积函数 < 2e-iC 3 , 从 

而当 a 充分大时这个区间上的积分< e. (3) 由15_1节的引理4我们知道，当 C # 0 
时， 1^(01 < 1- 由上节的引理3知道，当 ICI — oo 时， vKC) — 0. 由此推出 MOI 在 
ICI >5上的最大值等于一个数》/ < 1•于是 U " (長)叫私小于 

»/ n_1 [°° |v>f-^')|dC+ / e-i< 2 dC- (5.7) 

J-oo\ Vv n /I J|<|>«VS 

第一个积分等 T - Mv >\ 的积分，因此量 （5.7) 趋于 0. ► 

实际上利用这个证明可 得到① 稍强的结果：如果对某个整数 r，M r GL, 那么 
一致地有 — n. 另一方面， 15.3 节定理3的系说明，如果 Iff 都是不可积的，那 
么每个 / n 都是无界的，由于其奇特性，我们举例来说明确实可能出现这种病态. 

例 （ a > 对*>0和令 

= 5 ^- ( 58) 

设 g 是集中 T 上的密度，使得在某个区间上 g(a:) > «p(x). 存在一个区间5^,使 

得在这个区间内，单 调减少 ，且 

ff 3 *(*) > J o - I/)«p(y)dy > «4(*) = wa p (*). (5.9) 

利用归纳法可推出，对于 n = 2 fc , 存在- 个区间 OX, 使得广彡 《„ P ， 从而当*-0+ 
时， 9 "*(x)-»oo. 因此，所有的卷积 f 都是无界的. 

例 （b> 上例的一个变形以吏极端的形式显示出同样的病态.设 t; 是通过把 3 对称化所得 
到的密度，令 


/(*) = |[ u (* + 1) + «(* - I )】， (5.10) 

那么/是集中于 ^ 2 上的-个 偶概率 密度.我们可以假设它有单位方差. 上例 的分析 
表明，除了在原点外 ， u 是连续的，在原点外 v 是无界的. 同样的结论 对所有 的卷积 1；"* 
也是正确的.于是 / 2 n *( i ) 是值 «*"*(* + fc)(fc = 0,± l ,...,± n ) 的线性组合，因此它在 
点 fc(fc = 0,± l ,---,± n ) 处是无 界的. 密度为/的变量 Xj 的正规和 S a „/>/2 S 的密度为 
hn ( x ) = y / 2 Hf an '( xy / 2 n ). 除了在形如 k / y / 2 ^(k = 0，±1,…， ± n ) 的 2 n + 1 个点以外它 
是连续的，在这些点处它是无界的，因为对于每个有理点 t , 有相应的无穷多对 A , n 使得 
k / y / 2 fi = t , 所以 S „ A / S 的分布趣于饥，伹是密度 /„ 在任一有 J * 点上不收敛，序列 {/„} 
在每个区间上是无界的. 

①唯一的改变是，在 (5.7) 中把因子换成 v n ~ r , 换成，. 
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例 （ c ) 见习題 20. ► 

最后我们转向格点分布，即假设变量局限于取形如6,&±/»，6±2/ 1 ,...的值. 
我们设是分布尸的步长，即/»是具有上述性质的最大正数 .15.1 节的引理4说 
明 M 有周期 ZTr / h , 从而 M 是不可积的，然而对于 S n / y / fi 的分布的原子质量有 
一个完全类似于定理2的结论.所有这些原子都在形如 a ： = ( nb + kh )/ y / E 的点之 
中，其中 fc = 0, ±1, ±2, • • 对于这样的 A 我们令 

Pn (*) = p |^ = *|, (5.11) 

而设 Pn ( x ) 对于所有其他的 I 都没有 定义. 因此，在 (5.12) 中的 Z 局限于包含 
5 n / Vn 的所有原子的最小格. 

定理3 如果 F 是一个步长为的格点分布，那么当 — oo 时， 关于; E —致地有 
^^ Pn (*) - n ( i ) — » 0. (5.12) 

证由 (3.14) 可得 

窄咖■忐 O " (去 ) e 《 dc . _ 

再利用正态密度>1的傅里叶反演公式 (3.5), 我们看到 (5.12) 的左边由下式所控制， 

广 " A I ， (4) 叫以 / e - WdC . (5.14) 

J — ynn/h I W "/ I J | C |> V ™ i/fc 

在定理 2 的证明中巳指出，第 1 个积分趋于0.第2个积分显然趋于0,这就完成 
了 证明. ► 

15.6 林德伯格条件 

我们现在考虑这样的独立变量 X * 的序列，使得 

E ( X fc ) = 0, E ( Xl ) = a i . (6.1) 

我们用表示心的分布 ，用办 表示它的特征函数，照例令 《„ = & + ••• + 
X „,8 l = Var (5„), 于是 

»n = ^ i +-" + ^- (6.2) 
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我们称 { X k } 满足林德伯格条件，如果对于毎个固定的 * > 0, 

f x 2 i * k { dx } — > 0, n — » oo . (6.3) 

S n ^[ J \ x \> ta n 

粗略地说，这个条件要求方差 4 主要是由于长度比小的区间中的质量产生的 • 
显然， oi /< 小于 t 2 加上 (6.3) 的 左边. 由于 t 是任意的， (6.3) 蕴含对于任意的 
£>0和充分大的《， 

— ^ e, k = 1, • ■ • , n . (6.4) 

*n 

这当然殖含 -MX). 

a n / s n 可以看作分 M 对加权和 Sn /8 n 的贡献的一种量度，从而 (6.4) 可以 
叙 述为： S n / s n 渐近地是“许多单个可忽略 分量” 之和_林德伯格条件曾在 8.4 节 
(4.15) 中引入过，下列定理和 8.4 节的定理3 —致.每个证明都有它的 优点. 现在这 
个证明使得我们能够证明林徳伯格条件在某种意义上是必要的；它还可导致第16 
章中的渐近展开和密度的收敛定理（习题 28). 

定理1 如果林德伯格条件 (6.3) 成立，那么正规和 SJa n 的分布超于标准正态分 
布饥. 

证设（>0 是任意固定的.我们来证明 

V>l(C/»n) ••- Vn(C/«n) (6.5) 

因为戎(0) = 0且对于所有的 x ， Wl { x )\ < ol ， 所以由两项的泰勒展开式和 
(6.4) 推出，对于充分大的 n , 

bfc ( C /« n ) -IK l ^ 2 4/ s 2 n < ec 2 - (6.6) 

我们来证明，如果这是正确的，那么 (6.5) 等价于 

EMC /« n )- l ] + k 2 -0. (6.7) 

fc=i 1 

事实上，我们曾在 （2.4) 中看到， 〆 是一个复合泊松分布的特征函数，从而 
| e ^ _， |^ l . 对于任意使 |< x fc | 彡 l ,|6 k |< l 的复数 a k ， b k 有 

|oi ■ — 6i • • - 6„| < ^ |afc — 6fc|. (6.8) 

*=i 

此式可由下述恒等式用归纳法 推出： 

*1*2 - yiV2 = (*1 - 1/1 )*2 + (*2 - V2)yi- 
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对于任一 6 > 0,如果| 2 |充分小，那么我们有 \^- l - z \<6\ z \, 从而由 （6.6) 我 
们得到，对于较大的 n . 


_ Vl (C/a n ). ••V>n«/*n)l< 5 Z - V>k(C/Sn)\ 

k=il 

l^(C/*») - IK «(C 2 /^) E^ = <5C 2 - 


因为 J 是任意的，所以左边趋于0,从而为使 (6.5) 成立，当且仅当 (6.7) 成立. 


(6.7) 可以改写成如下形式: 


E /二 。 [ ellC/4B _ 1 _ 菩 + 备]凡(叫 — 。. (6.10) 

由基本不等式 (4.1) 推出，当 W 时，被积函数被 | xC /«„| 3 < t < 3 x 2 /^ 控制 i 
当 W > W Bt , 被积函数被 x \ 2 / sl 控制. 因此， (6.10) 的左边的绝对值 

<+ ‘VT f x a F fc { dx }. (6.11) 

k=l 

由林徳伯格条件（6.3)，第2项趋于0;因为 t 可以取得任意小，所以 (6.10) 成立. ► 
在8. 4 节和 8.10 节的习题17 〜 习题 M 中曾给出过说明性例子，在下面的习 
题26和习题27中也将给出说明性例子. 

下列定理包含定理1的一个部分逆. 

定理 2 餃设 s „ - oo ， CT „/ a „ — 0. 那么林德伯格条件 （6.3) 是 S „/ s n 的分布收敛 
于01的必要条件. 

警告我们即将看到，即使林徳伯格条件不成立， S n / a n 的分布也可能收敛于方差 
小于1的正态分布. 

证我们从证明 (6.4) 成立开始.根据假设，存在这样的 t /, 使得对于 n > u , aja n < 
e . 于是对于 u < k ^ n 我们有 < r k / s n < < T k / s k < e . 满足 A : < i /的 《/ 个比趋 
于 0, 因为 s n -* oo . 

其次假设 5„ A „ 的分布趋于91,即假设 (6.5) 成立. 我们在上一证明中已看到， 
当 (6.4) 成立时，这个关系式蕴含 (6.10). 因为 COS 2： - 1 + 彡0,所以被积函数 
的实部是非负的，因此左边的实部 

( 6 - 12 ) 
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于是对任意的 C 和 <，右边趋于 0, 从而 (6.3) 成立. ► 

条件 < r „/ S „ — 0不是严格必要的，这可由所有分布 F k 都是正态分布这一特殊 
情形 看出： 些时办可以取任意值，而 S „/ s n 的分布与 91 一致（又见习题 27). 但是 
条件 crjen - 0是保证各项 X * 的影响为渐近可忽略的一个很自然的方法.如无这 
个条件，问题的性质就有根本的 变化. 即使 ( Tn/Sn — 0, — OO , 林德伯格条件 

也不是“存在正规化常数 a „ 使 SJdn 的分布趋于 9 T 的必要条件.下例将阐明这 
种情况. 

例设 { X n } 是一个满足定理1的条件[包括 （6.1)1 的变董序列.设&是相互独 
立的且和 Xfc 独立，并使得 


f ； P{X ； ^0><oo. (6.13) 

n=l 

令 X „ = + X 〗，用軋和表示 { X ( „} 和 ( X n ) 的部 分和. 根据波雷尔-康 

泰利第1引理，以概率1只有有限多个 X ;不为0,从而以概率1有軋= 0(«„). 
由此容易 f 出， S „/ s „ 和 5„/ s n 的分布有相同的渐近 性质. 于 是即使4 不是义 
的方差， S n / s n 的分布也超于 01. 事实上，不一定有有限 期望. 如果 E ( X n ) = 
0, E (^) = ^< oo , 那么只有当 a n / a n 趋于一个极限 p 时， S n / S n 的分布才收敛. 
在这种情形下，极限分布是正态的，其方差 1. ► 

这个例子说明，即使分嫌的期望不存在，部分和 S „ 也可以是渐近正态分 
布的，并且方差并不总是对应的正规化常数.由于以下2个原因我们不在这里研究 
这个课题.第一，整个理论将包含在第17章中.更重要的是，上述定理的推广是极 
好的练习题，习题 2 9 〜习题 32是特意编选的，目的是推导中心极限定理的充要条 
件. 


15.7 高维特征函数 

高维特征函数的理论如此地类似于 R 1 中的特征函数理论，以致 T 系统的叙述 
看来是不必要的.为了叙述基本思想和记号，只需考虑二维的情形就够了.于是尤 
表示具有给定的联合概率分布 F 的两个实值随机变 M 和 x 2 组成的变董对.我 
们把 X 看成是一个具有分量 X !和的行向量；类似地，在 F ( x ) 中把变量 * 看 
成是分董为々和 a ： 2 的行 向憊. 另一方面 ，相应的特征函数的变量 < 表示列向量 
C = ( Ci ， C2 ). 这个约定有一个优点，即 *C 表示内积< = Ci*i + C2X2 . •(或 F ) 的 

特征函数^可定义为 


V «)= E ( e iX «). 


(7.1) 
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这个定义在形式上和一维中的定义一样，但是指数有新的解释，且积分是对二元分 
布进行的. 

二元特征函数的主要性质是显 然的. 例如选择= 0就把内积化成了 
从 M 表 示不的 （边缘）分布的特征 A 数.对于参數 Ci , C 2 的任一因定的选 

择，线性组合 ClXl +<2 X 2 是一个（一維）随机变量，它的持征函數为 

E ( e u « lX >+^)) = ^( ACi . ACa ), (7.2) 

此处 G 和 C 2 是固定的， A 是一个独立 变贵. 特别，和 + X 2 的特征函数为 
¥>( A , A ). 按照这种方式可用二元特征函数得出所有线性组合 + 的一元特 
征函数.反之，如果我们知道所有这样的组合的分布，那么可以计算出所有的表达 
式 WACuACO , 从而可以计算出二元特征函 数①. 下列例子说明了这个方法的有用 
性和灵活性，使用的是 3.5 节中引进的记号. 

例 （ a ) 多元正态特征函数.设 X = (■ X^&K 看作一个行向量!）有非退化正态分 
布.为了简单起见，我们假设 E ( X ) = 0,并用 C 7 表示协方差矩阵 E ( X t X ). 它的 
元索是咖= Var ( X *) 和 ci 2 =如= CovpG ,^). 对于固定的6和 C2 , 线性组合 
CX = CiX a + C 2 X 2 的期望为0,方差为 

a 2 = C T CC = CuCi + 2 c 12 CiC 2 + C 22<1 (7.3) 

把入看作一个独立变量，那么变董 XC = C 1- X-J + ( 2 X 2 的特征函数为于 
是 X = (X U X 2 ) 的二元特征函数为 

<^(0 = e - K T CC (7.4) 

这个公式在 r 维空间中也成立，只是这时 C T CC 是 r 个变董 (： v ,-.., C r 的二次型. 
因此， （7.4) 表示期望为0协方差矩阵为 C 的 r 维正态分布的特征*數. 

有时需要把两对变董和 ( Ci , C 2 ) 变成极坐标，即由下式引进新的变 

贵： 

Xi = Rco8 O, X 2 = jRsin 0, 

Ci = pcosa, Ca = psina. 

决 于这样的变换见 3.1 节 .） 这时 

ip(C) = E(e 1#,Bcoe ( e - Q )), 

但是必须记住这不是变量对 （ B , 0) 的特征函数; （ fi , 0) 的特征函数为 E ( e ! «>»+*»)). 

①这就顺便地证明了， R 2 中的*率分布由所有半平面的*率唯一确定 .（H. 克拉美和沃尔特 (H. 
Wold) 注意到的）这个亊实似乎无法用初等方法得到.关于对矩的应用见习 * 21. 


(7.5) 

(7.6) 
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例 （ b ) 旋转对称. 当对偶表示一个 “具有 随机方向的向 量”时 （见 1.10 
节 )，（ 尽 0) 的联合分布可分解为/?的分布 G 和=5^上的均匀分布的乘积.于是 
(7.6) 中的期望与 a 无关，并且呈下列形式： 



V>(Ci,C2) = (271)- 1 J : G { dr } 厂 

(7-7) 

变童替换 COS 0 = 

i 把内层积分化为习题6所讨论的积分，于是 



沪 ( Cl . 6) = 乂 Jo(/>r)G{dr}(/» = y /^ + ^), 

(7-8) 

其中 

秘)= = (昏广 

(7.9) 


(贝塞尔函数/ 0 是在 2.7 节中引进的 .） 

具有随机方向的单位向量使分布 G 集中在点1 上.于是是》个 
独 立的具有随机方向的单位向量的合向量的 特征* 數. 这个结果是瑞利在研究随 
机飞行时导出的 • 

例 （ c ) 我们考虑一种特殊情况，即 ( Xr , X 2 ) 有二元密度 

/( xi , x 2 ) = (2 n ) _1 a 2 e _ar , r = y/xj + x ^, (7.10) 

其中 a 是一个正 常数. 于是 (7.8) 呈如下形式 

P ( Ci ， C2 ) = a 2 j e~ ar Jo { pr)rdr = (1 + p a / o 2 ) _ 8. (7.11) 

例 （ d ) R 3 中的旋转对称.例 （ b ) 可以照搬到三维中去，只是现在我们有2个极 
角：地理经度 a ; 和极距 (?• (7.7) 中的内层积分呈形式 


1 /•*/ 2 


e irpco6fl 8infldfl 

9 + e -irpco.» )ginM ^ 


①用 •/() 的表达式 （7.9) 代替而，我们得到 


必 ( 1 ) ( 5 )*. 


(7.12) 


这是 （1 + ^/0 3 )-§的二项级数. 
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其中= Ci + d + Cl - 代换 cosfl = i 把此式化为 ( rp) -1 sinrp , 从而有一个类似于 
(7.8) 的公式 

¥>( Ci , C 3 ,<3)= r ^ G { dr }, (7.13) 

Jo rp 

特别，对于单位随机向惫，这个积分化为 p - l smp , 令 C 2 = C 3 , 我们可以看到单位 
随机向董的 X :分量的特征函数为 Cf ' sinCi - 于是我们得到了 1.10 节所建立的下 
列事实的一个新证明 ：这个 分童在7上是均匀分布的. ► 

可以留给读者去验证，关于一维特征函数的主要定理无需本质上的改变就可 
照搬 过来. R 2 中的傅里叶反演定理说明， 如果 W 在整个平面内是（绝对）可积的， 
那么 X 有有界连读密度 

+00 

f ( xi , x 2 ) = ^jj < 2 ) dCidC 2 . (7.14) 

例 （ e ) 二 元柯西 分布. 把反演公式 (7.14) 应用于例 （ c ) 的密度/,并用/(0,0)= 
(2«)- 1 a 2 除以所得的结果，就可看出 

KCx ,<2) = e - a v ^ TK | 

表示下式定义的二元密度的特征函数： 

5(Xl>l2) = 2n(a 3 + x? + xi)! 

由此推出，这个密度具有普通柯西密度的主要性质.特别地，它是 严格穗 定的： 如果 
X ⑴，…, X ( n ) 是密度为 (7.16) 的相互独立向 董值变 撤， 那么它们的平均值( X ⑴+ 
••• + X < n ) )/« 有相同的密度. ► 


(7.15) 

(7.16) 


*15.8 正态分布的两种特征 


我们从一个由 P . 列维猜测到的在1936年被 H . 克拉美证明了的著名定理开始. 
遗憾的是它的证明依赖于解析函数论，因此和我们关于特征函数的讨论不大协调. 
定理 1 设和 X 2 是独立随机 变量， 它们的和的分布是正 态的. 那么和 X 2 
都是正态的. 

* 本节讨论的》題较特殊，只在习 * 27 中用到. 
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换句话说，正态分布是不能分解的（除了以微不足道的方式分解外).上面的定 
理的证明是以下列具有某种独立意义的引理为基础的. 

引理设尸是这样一个概牟分布，使得对于某个»/>0, 

/⑻= 广 < 00 . (8.1) 

那么特征函數是一个（对所有复數 C 都有定义的）整函數.如果对于所有的复数 
C ,¥>(0^0, 那么 F 是正态的. 

引理的证明 对于所有的复数 （ 和实数 H 我们有 IzCI < ^ x 2 + »7- 2 | C | 2 , 从而 
定义 W 的积分对所有的复数 C 都收敛，并且 

⑻. ( 8 . 2 ) 

这就是说， P 是一个阶数 < 2的整函数，如果这样的一个函数没有零点，那么 
log¥>(0 是二次多项式 ® ，因此 vKO = e - i < a+i6 <, 其中 a,6 是（可能为复数的）数. 
但是， P 是特征函数，从而 - i ^(0) 等千期望， -^(0) 是分布的二阶矩.由此推出6 
是实数 ， a > 0,因此 F 确实是正 态的. ► 

定理 1 的证明 不失一般性，我们可以假设变 M Xi 和 X 2 已这样规定了中心，以 
致于原点是每个变贵的中位数. 于是 

P{|^j + X 2 \> t )^ ^ P {\ Xi \ > t }. (8.3) 

利用通常的分部积分[见 5.6 节 1 可证明 

f ( v ) < # 厂 1 . [1 - F ( x ) + F (- x )] dx , (8.4) 

因此相应于 x * 的函数 /* 满足不等式 Mv ) < 2/(7,) < 00 . 由于糾(0内 (0 = 
所以奶和¥> 2 都不可能有零点，因此和义 2 都是正态的. ► 

我们转向在 3.4 节中引进并讨论过的正态分布的下列特征的一种证明. 

定理2 设 Aj 和义 2 是独立变责，并且 

Yl = flllXi + <*12-^2) ^2 = 021-^1 + < 122X2 - (8.5) 

如果 VI 和 y 2 也是相互独立的，那么或者所有4个变量都是正态的，或者变換 (8.5) 
在 Vi = aXi 和 Y 2 = bX 2 或= oX 2 和 v 2 = 的意义上是不足道的. 

①例如见 E. Hille, Analytic function theory, Boston, 1962, vol. II, p- 199( 两达马 (Hadamard) 
因式分解定理). 
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证对于具有连续密度的变量X』的特殊情形，这个定理在 3.4 节中已证明过了. 
证明依赖于 3.4 节 (4.4) 泛函方程的一般解，我们现在来证明，随机变量&的特 
征函数灼满足一个同样类型的方程.我们首先说明只要考虑实的特征函数就够了. 
这个论证说明了定理1的用处. 

(a) 化成对称分布.引入一对相互独立且与X,.独立的变童 Xf 和 X ^, 它们分 
别与-不和 -X 2 有相同的分布.线性变换 （8.5) 把对称变量= Xj + Xr 变成 
—对独立的对称变量 (° Yi ,°Y 2 ). 如果定理对这样的变童成立，那么 D 七是正态的. 
根据定理1,这蘊含X』也是正态的. 

(b) 泛*方程. 由于假设 K 和 K 独立，所以 ( Y u Y 2 ) 的二元特征函数一定能 
分解为 

E ( e KCi Vi+Ca ⑸） = E(e ltlYl )E(e iCaVa ). (8.6) 

把 (8.5) 代入，我们看出，这个关系式蕴含下列关于和叉 2 的特征函数的恒等 
式 | 

«»21(2)内(<»12(1 + <122(2) 

= ^l^nCi^CoiaCiVi (<P 3 iCa)<P 2 (a 2 aC 3 )- (8.7) 

除和 a 21 的作用变换了以外，这个恒等式和 3.4 节 (4.4) 是一致的.根据假设，％• 
是连续实函数，正如在 3.4 节中所看到的那样，可以假设所有的都不为0.因 
此，根据3. 4 节的引理，灼 (0 = 从而X,是正态的. ► 

15.9 习 题 


1. 利用不等式 (1.7) 证明（不用计 算)， 对每个特征函败 a 



Iv»(0l 3 ^ 1 ~~ y )1 < 

(9.1) 

2. 如果 p = t 

i + iv 是-叶特征函败，证明， 



« 2 (0<|(1+«(20). 

(9.2) 

这又蕴含 

b(OI 3 <|(i + M2C)l). 

(9.3) 


提示， 利用施瓦兹不等式证明 (9.2), 证明 (9.3) 时考虑形如 e' a V(C) 的特征函数. 
3. 证明（记号同上 


1^«3) - v(C0l a ^2[i-«(< 8 -Cl)]. 


(9.4) 
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当 Ci = 时，此式包含 (1-7). 

4. 利用初等公式证明（无需明确地求出积 分)： 密度 （l/n)【(l - cos®)/* 3 ] 的特征函数 p 
与2|<| -IC+1I-IC-1I 只相差4常数因子. 证明： 对于 |<| < 1,^(0 = 1 - ICI- 

5. 利用密度的特征函数通过关于 a 的简单微分来推导--个新的特征函数.利 
用这个结果来 证明： 给定的分布与其本身的卷积有密度^06-1*1(1+ 0 |*|). 

6. 设/是由下列定义的集中于 =TTT 上的 密度： 

/(：B) = ^ W - (9 _ 5) 

证明> 它的特征函数为 

^(0 = £ (^) = Jo (0. (9-6) 

注意 MO = /o(iO, 其中 Jo 是 2.7 节式 (7.1) 中定义的贝塞尔函数.提 示：把 展 
成幂级数 .C n 的系数是用积分给出的，利用分部积分对 n 用归纳法可以验证 (9.6). 

7. 具有集中于上的密度 \/[ ny / x {\- x )\ 的反正弦分布的特征函败为 e W 2 J 0 (C/2) .提 
示，化为上题. 

8. 利用表15~1的第10号来 证明丨 2jt a i. (sinha:)- 1 是一个特征函败为2/[1 + C08h(« c )] 
的密度.提示< 利用 2.9 节的习题 6. 

9•设表示 15.2 节例 （ c) 所述的周期为 2L 的特征函数.证明 ，- 1L 也是- 个算 
术分布的特征函数.它的图形可通过在图2中每隔一个三角形关于 C 轴反射一个三角 
形而获得. 

10. ® 设X和 y 是独立的，其分布函数分别为 F 和 G, 特征函数分别为 p 和 7. 证明： 
乘积 XY 的特征*敷为 

J 7(C*)F{dz} = / v>(C*)G{dx}. (9.7) 


11. 如果 { v > n } 是这样的-个特征函数序列，使得对于-占< C < S , M 0 - 
所有的 <#„(<) — 1. 

12. 设是一个特征函败 7 为严格正的偁密度，那么 

_ g(j)[l -C06 0X] 

-7( a ) 


9 a { x ) = 


,那么对于 


(9.8) 


(9.9) 


是一个特征函数为 

- 27(0 - 7(C + a) - 7(C - o) 

7 ° (C) - 2(1^)] - 

的概率 密度. 当 a — oo 有 7a — % 但是 9。 — J 7 却不成立.这就说明了在密度的连续 
性定理中，条件 （3. 10) 是必不可少的. 

①把 （9.7) 与 5.9 节例 （b) 的脚注中的定理结合起来，可得下列的辛炊准則■函数 w 是一个单峰分 
布的特征函败，当且仅当 u»(C) = ^ ACx ) dx , 其中¥>是一个特征函数. 
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13. 如果是一个实的特征函数，且 <y > 0,那么存在特征 函数％ 为严格正的偶密度 g „, 
使得7» — r 提示：考虑混合 ( l - e)G + eF 和卷积. 

14. 如果 7 是一个满足7 > 0和 > r ⑷/ 1的特征函数，那么 （9.9) 确定了一个特征函数 • 
提示 | 利用上两题 • 

15. (4.7) 之逆的推广. 考虑分布 （ l / tnMa ^ J ^ dx } (当它们存在时)，用归纳法证明：为使分 
布 F 具有有限矩 m 2r , 当且仅当特征函数在原点的 2 r 阶导败存在. 

16. 设/是一个具有正的可积特征函数的概率密度.那么/有唯一的一个最大值，此最大 
值在原点达到.如果二阶导数 /" 存在，那么 

/⑼> /⑻> /⑼- ^■广⑼， (9.10) 

类似的展开式对泰勒展开式前 2 r 项也成立.[注意/是偶函数，从而/ ( afc +1) (0) = 0.] 

17. 设 V 是 - 个具有二阶连续导 数 〆 ' 的实特征函数.那么脾非对于所有的<,¥>(0 = 1]. 

矽 ⑹ -G |，⑼ | 

是一个偶密度/ 2 的特征函数，这个/ 2 对于 I > 0被定义为 

wmr [1 ~ m]dt - 

试向高维推广. 

18. 设/是一个具有特征函数 V 的偶密度.对于 * > 0,令 

ff (*) = J ’ (: g (- x ) = g ( x ). 

那么 S 也是偶密度，并且它的特征函数为 

7(0 =会乂 V >( s ) da - 

19. 设7是这样的一个特征函数，使得当 C - oo 时 17(01 = 1- 相应的分布 F 是纯奇异的 
. (关于勒贝格测度). 

20 •假设 Cfc > 0, fck = 1 ,但是= 00 .设 u 是集中于=171上的连续偶密度， a ; 
是它的特征函数，那么 

f ( x ) = Y , c >.2 k n (2 k x ) (9.16) 

也定义了一个密度，除了在原点之外，这个密度是连续的，它的特征函数为 

v (0 = E Cfca , ( 2_ fc 0- (916) 

证明 M " 对于任一 n 都是不可积的.提示< 对于 * / 0, (9.15) 中的级数是有限的.利 
用显然的不等式 ( X ) C * P*)">E c * Pk . 此式对 P ">° 成立 • 


(911) 

(9.12) 

(9.13) 

(9.14) 
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21. R 2 中矩的问超.设 A 和 X 2 是两个具有联合分布 F 的随机 变董. 令鳥= E (| A - i | fc ) + 
E (| X a | fc ), 证明 I 如果 limsupfc - U ^* < 00,那么 F 被它的矩所唯一确定.提示，正 
如 15.7 节第1个脚注所指出的那样，只要证明所有线性组合 a 1 X 1 + a 2 X 7 的分布被 
唯一确定就行了.利用准则 (4.15). 

22. 退化的二元分布.如果 p 是一^一元的特征函数， a,,a 2 是任意常数，证明，作为 Ci,<2 
的函数， <^(aiC，+ o 2 Cj ) 表示一^满足 a 2 Xi= aiX 3 的对偶 ( X U X 2 ) 的二元特征函数. 
试述其逆.考虑 a 3 = 0 的特殊情形. 

23. 设 X , y , I / 是具有特征函数 < p , u , w 的相互独立随机变量.证明，乘积 ^( Ci ) KCa)«(Ci + 
Ca ) 表示对供 (U + X,U + Y ) 的二元特征 函数. 提示，利用三元特征函数. 

中心极限定理的例子与朴充 

24. 利用特征函败的方法证明 8.4 节中关于随机和的中心极限定理 4. 

25 •设厶 有密度 e -*®°*-»/ r ( o fc ), 其中 a * — oo . «„的方差是4 = ( a 丨 +…+ a „) •证 
明： 如果 

s n 2 5Z a * ~* O ' 


那么 { X k } 满足林徳伯格条件. 

26 .设 P { X * = ±1} = (*- l )/2 fe , P { X fc = ±Vk}= l / 2 k . 不存在这样的正规化常数 a „, 
使 Sn / an 的分布趋于91,提示，利用 



讨论指败分布 • 

27. 如果 S n / s n 的分布趋 T 但是 an/an — p > 0,那么 X n / a n 的分布趋于一个方差为 

P 3 的正态分布. 提示， 根据1 5 .8节的克拉美-列维定理，如果01 = U - kV , 那么 t / 和 
V 都是正 态的. 利用 X „/ 8 „ 和 Sn - l / 8 „ 的分布的收敛子序列. 

28. (密度的中心极限定理） 证明， 如果把充分一致性条件加在特征函数上，那么 15.5 节 
的定理 2 可推广到具有可变密度 /* 的序列上.例如，只要三阶绝对矩是有界的，并且 
U 有这样的导败，使得对于所有的 fc , |/ i | < M 就行了. 

29- (三角形阵列的中心极限定 *) 对于每个 r » 设 X „,„ 是 n 个具有分布巧.„的 
独立变童. « T „= Xi ,„ + + X n ,n 假设 E ( X fc ,„) = 0, E ( T *) = 1,且对毎个 t > 0, 

J M>t i ^ fc . ntdx } 0. (9.17) 


证明 ： r „ 的分布趋于 91. 提示，采用 15.6 节定理1的证明. 

注林徳伯格定理表示 x„, n = X k / m 和 r „ = S n / a n 的特殊 情形. 于是 (9.17) 化为林 
徳伯格条件 (6.3). 关于三角形阵列见 6.3 节. 
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30. (截尾）设{ X *}是具有对称分布的独立变与 序列. 对于毎个《和 fc < n , 设是 
把 X fc 在 ± o „ 上截尾得到的变量.假设 X ) P {| X fc | > a „} — 0且 (9.17) 成立•证 

fc=i 

BJ . S n /an 的分布趋于 91. 

31. (广义中心极限定理）假设分布八是对称的，并且对于每个 t > 0, 


U F fc { d ®} 0, 


f * 2 F*{dx} 

k=l J |* l<*On 


(9.18) 


利用下列两种方法证明 S„/an 的分布趋于01^ ( a ) 利用上两®, ( b ) 仿照 15.6 节定理 
1的证明来直接证明.① 

32. (续) • 对称性条件可以换成较弱的条件 

V / iF fc { dx } Uo . (9.19) 

M Kl-lo*" I 


33. 为使满足条件 (9.18) 的正规化常数 a „ 存在，当且仅当存在一个 — oo 的数列，使 
得 „ „ 

^2 I Ffc { d ®}— 0, ( x a Fk{dx} -♦ 00 . 

k=l • / l * l<»n tn k=\ 

在这种情形下，我们可以取 

= f x^Fkldx}. 

(这个准则通常是不难应用的 .） 


①定理2可类似地推广，但是证明方法不同. 
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本章的论题是高度专门的问题，可以分成两类.一类问题是获得中心极限定理 
的误差估计，并通过给出的渐近展开式来改进这个结果.一类具有完全不同性质的 
问题是对独立变董的较大的值补充中心极限定理，对这样的值古典的阐述没有意 
X. 

为了容易理解重要的定理和解释基本的概念，我们把同分布变量的情形分离 
出来.关于大偏差的 16.7 节是与前5节无关的.在这些节中所叙述的理论主要依赖 
于两个方法， 绝对收敛的傅里叶积分的直接估计与磨光法.不惜重复，也不惜损失 
一些优美的叙述，我们通过首先讨论密度展开式把两个主要的概念分开. 

本章的关键是 16.5 节的贝利-埃森 ( Berry - Esseen ) 定理. 贝利 （ A . C . Berry ) 在 
这个定理的证明中首次利用了 16.3 节所述的磨 光法. 无数种磨光程序被普遍使用. 
事实上，本章这个主题的长期和辉煌的历史有一个不幸的影响，即历史发展的偶然 
性仍然影响到个别课题的 讨论. 结果所得的工具的多样性和方法的丰宫性使这个 
领域以凌乱而出名.下面我们系统地应用贝利方法和现代不等式，这使得整个理论 
达到了惊人的统一和简化 .® 

16.1 记 号 

除了最后一节(它讨论不相等分童)外，我们用 F 表示具有特征函数的一维 
概率分布•当 A 阶矩存在时，它将被表示为 

糾 = J x fc F { di }. (1.1) 

我们假设/ XI = 0, 又照例令 M3 = ff 2 . 我们记正规化了的 n 重卷积为 F „. 于是 
^n(*) = F"*(x<7>/n). (1.2) 

当的密度存在时，我们用/„表示它. 

* 本章讨论专门的论埋，初读时可以略去. 

① H . Cram 6 r (1962) 是渐近 M 开式的 最好入门书. 它包括 16.2 节和 16.4 节中关于两分布变量的展开 
定理及16,7节定理的略为明 S 的 变形. 展开式定理的第一个产格论述应归功于克拉美，但是他的方 
法不再被人使用了. Gnedenko and kolmogorov ( 1954) 讨论了 16.1 节 〜 16.5 节的材料. 
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(1.3) 


(1.4) 

u 和 v 都是可积的.如果《是一个概率密度，那么1；是它的特征函数.为了简单起 
见，我们引入 

约定 (1.3) 中的* 数 t ; 称为 u 的傅里叶变換， (1.4) 的右边称为 u 的傅里叶范数 
和通常一样，正态密度被表示为 

n ㈤ = ⑽ 

它的傅里叶变换是特征函数 e - i < 4 . 因此，通过累次微分，我们得到恒等式 

对 fc = 1，2,… 成立. 显然,左边具有形式 

^n(i) = (~l) k H k (x)n(x), 

其中 i /* 是 fc 次多项式 . Hfc 被称为埃尔米特 ( Hermite ) 多项式 ® . 特别 
H\{x) = x, Hi{x) = x 2 — 1, H^{x) = I s - 3x. 

于是机的特性是 H fc ( x ) n ( x ) 有傅里叶变換 ( iC 2 )* e - i < a . 

16.2 密度的展开式 

当某些髙阶矩抑存在时， 15.5 节的关于密度的中心极限定理2可以大大地加 
强.一个重要的假设是 ® 对于某一 

J wor^c < oo- (2.1) 

①有时被称为切比雪夫-埃尔米特多 項式. 术语不是 I 雀一 的. 许多正规化的因子被利用，经常以 
代替我们的 

® 关于这个条件见 15.5 节倒 （ a ) 和例 （ b ) 以及 15.9 节的习 * 20. 


(1.6) 

(1_7) 

( 1 . 8 ) 


除了讨论大偏差的 16.6 节外，我们将讨论形如 

«(*) = e _i< *i/(C)dC 

的函数和明显的估计 

i«(*)i < ▲ y * i«(oidc- 
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15.5 节中给出的证明可以粗略地概述 如下. 差《« = /„ - n 有傅里叶变换 

(2 . 2) 

| v „| 的积分由于两种原因趋向于 0. 给定一个任意小的但固定的5 > 0,由于 
(2.1), KI 在区间 Id > SaVfi 上的积分趋于0•区 Id < StTy / a 内，根据必在原 
点附近的性质，被积函数 v „ 很小.后一结论只依赖于 m = 0和 M 2 = /这个事实. 
当高阶矩存在时，我们可以利用#的泰勒展开式中更多的项，于是得到关于收敛 
/„-* n 的速度的更梢确的知识.很遗憾，当涉及3个以上的项时，这个问题在记号 
上就很复杂了，因此我们分离出最简单和最重要的特殊情形. 

定理1 飯设 w 存在，对某一 v 彡 l . l ^ r 可积，那么对 n > i /,/„ 存在，且当 
n -* oo 时，关于 * 一致地有 

f n ( x )- n ( x )- ^_(* 3 - 3 x ) n ( x ) = o . (2.3) 

证明根据 15.3 节的傅里叶反演定理，对 n > I /, (2.3) 的左边存在且有傅里叶范 
数 

队 =4 /:: k ⑸ - e - K ’ - 為⑽叫< ( 2 . 4 ) 

取5 > 0为任意固定的数.由于是一个密度的特征函数，所以对于 1 C | # 0我们 
有 IvKOI < 1, 且当 ICI — oo 时有屮(0 — 0(15.1 节的引理 4 和 15.4 节的引理 3). 
因此，存在一个数丨< 1,使得当 ICI > <5 Bf , |¥>( C )| < qs - 于是区间 | C | > 对 
(2.4) 中的积分的贡献 

<«-- £>(忐)「叱 + 又喊，* £ '( 1+ 1 竽 [K ( 2 . 5) 

这比 1/ n 的任何次幂趋于零的速度都快. 

利用简化式 ® 

v>(0 = lnv?(C) + ^C 2 , (2.6) 

因此我们有 

^去/一叫 哪卜 (4 s ))- 1 - 5^ S K ) 1 dc+ 。⑴ . (2 . 7) 

①以后所用的复数的对数是以当 | z | < 1时成立的泰勒级数 In ( l + i ：) = S (- z )"/ n 磯定的.没有 z 的 
其他的值出现. 
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被积函数可以利用下列一般格式进行估计 ■ 

|e°-l-^| = |(e a - 〆)+ (〆 - 1 - 用 | < (|a - 0 \ + ^ 2 ) e' (2.8) 

其中 maxdal ，^}. (把 e ° ■和 # 换成它们的幂级数，就显然可以看出，这个不 
等式对任意的实数或复数 a 和/?都成立 .） 

函数岭是3次可微的，并且岭(0)=妒⑼= W 0) = 0,而 rl /"( 0 ) = iVa . 因为 
r ' 是连续的，所以可以找到原点的一个邻域 ICI < A 使得在这个邻域内少"的变 
化小于 e . 由3项的泰勒展开式，我们可得 

| V >( C ) - ^3( i 0 9 | < « t 3 | C | 3 , 对于 ICI < S . (2.9) 

此处我们选取 <5为如此之小，以致于也有 

1^(01 < |^ M 3( iC ) 3 | < ^ ff 2 C 2 对于 ICI < & (2.10) 

根据 <5的这种选择，利用 (2.8) 可见 (2.7) 中的被积函数小于 

_ 

因为《是任意的，所以我们有队= o { M ^ n ), 因此 (2.3) 成立. ► 

同样的论证可导致高阶展开式，但是它们的项不能用简单的明显公式表示.因 
此，我们推迟研究所涉及的多项式明显构造. 

定理 2 假设矩坳,…，汾存在，并且对于某一《/> 1,|¥>广 可积.珲么对于 n>i /存在，且 
当 n -*• oo 时关于; c 一致地有 

/„( x )- n ( i )- n ( x )^ n - i fc +1 ft ( i ) = o («- i r+1 ). (2.12) 

k=3 

此处 ft 是一个只依轜于…， Mfc 而不依賴于 n 和 r (或相反，依轎于 F) 的实多 项式. 

前2项为 

ft = Pa = ^8 H *' ( 213 ) 

其中讥表示 （1.7) 中所定义的埃尔米特多项式.展开式 (2.12) 称为（或者过去常称为)/„ 
的埃奇沃思 ( Edgeworth ) 展开式. 

证我们沿用记号 (2.6). 如果 p 是一^具有实系数 Pi , P 2 , -- 的多项式，那么 


/n — n — xiEpicHk 


( 2 . 14 ) 
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具有傅里叶范数 

Nn = iiJ :: e _ i < 2 卜卜 (*)) _ 1 _ 咐)卜. _ 

我们将通过求出适当的多项式 P 来证明定理 1. (为了使记号简单，我们不强调它们对 n 的 
依赖性 .） 

我们从估计被积函数开始.程序和上-定理的证明一样，所不同的只是现在我们利用 
妒的直至 r 次项（包括 r 次项）的泰勒逼近.这个逼近将被表示为 C 2 MO - 于是必 r 是一个 
满足 V>r ⑼= 0的 r - 2次多项式，它由性质 

V-«)-<Vr(0 = o(Kl r ), C-0 

唯-确定. 

我们现在令 

»( c ) = g 去卜(表)广 （柳 

于是 P(iO 是一个具有依赖于 n 的实系数的多项式.另一方面，对于固定的 c,p 是 1/W 的 
多项式，其系败可以明显地表示为 Ml,M2, ',Mr 的多项式.和上一定理中的证明一样，显 
然对于固定的> 0,|C|> JffVS 对 (2.15) 中的积分的贡献比 l/»i 的任一次幂趋于零的速 
度都快，因此我们只需对|<| < Stry / H 考察被积函败.为了估计它，我们利用在 |a| < 7和 
|/?|<7时成立的不等式 [M 不是利用 (2.8)] 

卜 。 - 1 _ 琴#/ 叫 ^K-e^l + l^-l- £V/fcl| 

(217) 

按 (2.9) 类推，我们现在确定一个5,使得当|<| < 5时， 

IV>(0-<Vr(0l<^ r lCl r - (2.18) 

因为咖中的 C 的系数是 i 3 M3/6, 所以我们可以假设，对于 K| < d 也有 

IVV(C)I < o|CI < (2.19) 

只要 a > 1 + |/x s |. 最后我们要求对于 |CI < 在， 

IV-COI < - (2.20) 
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于是对于 ICI < Say / H , (2.15) 中的被积函数小于 

叫舞為媒). 网 

因为 e 为任意的，所以我们有 JV n = o ( n - W »). 

于是我们求出了这样的依赖于 n 的实系败 p *, 使得 (2.14) 的左边关于 a : —致地为 
0(«~^ +1 ).对于固定的 C , 左边是 1 / y / a 的多项式.按照 l / y / fi 的升碁次序重排这个多项 
式，我们得到定理中所假设的那种形式的表达式，所不同的是现在的求和超过但是可以 
去掉包含幂 l / n fc , 其中 fc > |r - 1的诸项.于是我们得到所需要的展开式 （2.12). ► 

因此，多项式 ft 的明螭定义如下所述.一个 r _2 次多 項式如 由在原点 W 近成立的 
泰勒公式 

一 (0 = c a [ - + Vr ( C )] + o(|CD (2.22) 

咪一 确定. 桉照 1/VH 的幕重徘 （2.6) .用办 (iO 表示 rTi * +1 的系数.于是 ft 是这样的一 
个多项式.使得 n ( ar ) ft (*) 有逆傳里叶变換 e - i < 2 «( iC ). 

16.3 磨 光 

密度/„的每个展开式都可以通过积分导致分布的一个类似展开式，但是 
当可积性条件 ( 2 . 1 ) 不成立时，这个简单程序是不能用的.为了对付这种情况，我们 
应该间接地进行（遵循 A . C . 贝利) • 为了估计偏差 F n -« 或一个类似的函数△， 
我们将利用上节的傅里叶方法估计 △ 的一个近似式然后用直接方法来估计 
差误 T 在本节我们将叙述这个程序的基本工具. 

设作是具有密度 

..11 — cobTx . 、 

叶 ⑻ TV (3- 1 ) 

和特征函数听的概率分布.对于 ICI 矣 r , 我们有 

«^(0 = 1 -爭， (3.2) 

但是这个明显形式并不重要.重要的是，对于 | C |> T , wr ( C ) 等于0,因为这种情况 
排除了所有的收敛性问题. 

我们对 i ^ n - SH 的界，更一般地对形如 △„ = - G „ 的函数的界感兴趣.这 

样的函数可以利用它 们与作 的卷积来逼近，我们一般地设= VricA . 换句话 
说，给定任一函数 A , 我们定义 

r △⑷= J A(f- x)vr(.x)dx. (3.3) 
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如果 △ 是有界且连续的，那么当 T - oo 时 1 我们的主要问题是利用 | r A | 
的最大值来估计 | A | 的最大值. 

引理 1 设 F 是一个概率分布， G 是一个这样的函數，使得 G (- oo) = 0,G(oo) = l, 
且 ] G '( x )\ < rw < oo . 

令 


那么 


证函数 △ 在无穷远处等于0,单侧极限厶 (: r +) 和 A (®-) 处处存在，从而在某 
盘 x 0 上或者 | A (® 0 +)| = »7或者 | A ( x 0 -)| = V - 我们可以假设 △(*(>) = t ?. 由于 F 
不减，且 G 以速度< m 增加，所以对于 a > 0, 

A(xo + s ) ^ f ； — ma . (3.7) 

令 

h = t = xo + h , x = h - 8, (3.8) 

那么对 M < h , 我们有 

A (< - a :) ^ I + mx . (3.9) 

我们现在利用 (3.9) 和 W > / i 时的界厶 ( f - a :) > 来估计 (3.3) 中的卷积积分.由 
对称性，线性项的贡献等于0,由于密度叶对 W > 賦以质董 < 4/(« Th ), 所以 
我们得到 

= 2 _ ^ = 2 ~^- (310) ^ 
在我们的应用中， G 的导数或者和正态密度 n 重合，或者和上节所述的有 
限展开式之一 重合. 在每种情况下，9都有一个具有2次连续可微的傅里叶变换 7 , 
且使 W 0) = 1, Y(0) = 0. 于是显然卷积= V T irg 具有傅里叶变换 7 ^ r - 类似地， 
根据 15.3 节的傅里叶反演定理，乘积 wr 是 Vr - kF 的密度 T / 的傅里叶变换.换 
句话说， r 

T / ⑻- r 咖 ) =^j T e _iCl b(0 - 7(C)W(C)dC- 


A ( x )^ F ( x )- G ( x ), 

(3.4) 

*7 = sup | A ( i )|, rtr = sup | t A ( i )|, 

(3-5) 

ij 12 m 

(3.6) 


(3-11) 
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关于 x 积分，我们得到 

T A(*) = e-^ y(C) _~ c 7(C W(C)dC- (3.12) 

没有积分常数出现是由于当 M - oo 时两边都趋于0,左边是由于 F^-GOc) — 0, 
右边是根据 15.4 节的黎曼-勒贝格引理4_注意到 vKO) =飞⑼=1,/(0)= 7^0) = 
0,从而被积函数是在原点上等于0的连续函数，因此不出现收敛性的问题. 

我们从 (3.12) 得到财的一个上界，把它与 (3.6) 结合起来可得到7/的一个上 
界，即 

\F(x)-G(x)\^^ 乂 : r (C) Z 7(C) |dC + 菩 . (3-13) 

因为这个不等式是下两节中所有的估计的基础，所以我们扼要重述它成立的条件. 
引理2 设 F 是一个具有期望0与特征函數的概率分布.级设 F - G 在 ±oo 
上等于0, G 具有一个使 W < m 的导數丨最后伋设0具有一个连续可撳的傅里 
吋变换7,使得 7(0) = l,y(0)=0. 那么 （ 3.13) 对于所有的 邶 和 r>0 成立. 

我们将给出这个不等式的两个独立的 应用. 在下节中，我们将推导 16.2 节中的 
展开式定理的积分形式•在 16.5 节中，我们推导偏差& -91 的著名的贝利-埃森 
(Berry-Esseen) 定理. 


16.4 分布的展开式 

我们从密度的展开式 (2.3) 通过简单的积分可得 

仙 )- 91 ⑻-為 d -⑻=。(去). （4: 1 ) 

为使这个展开式成立，不需要 F 有密度.事实上，我们现在将证明 (4.1) 对除了格 
点分布（即 F 集中于形如 b±nh 的点集上时）以外的一切分布都成立.对于格子点 
分布， 15.5 节 (5.12) 反浪公式表明 ，凡 的最大珧跃的数量级为 1/0J, 从而 （4.1) 
对任一格点分布不成立.但是，即使对于格子点分布来说，下述定理只需做很小的 
修正就仍成立.为了方便起见，我们分2种情况讨论. 

定理1 如果 F 不是格点分布，并且三阶矩抝存在，那么 (4.1) 对所有的 * —致 
地成立 • 

证设 

G(x) = m(x)~ - !)«(*), (4.2) 
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于是 G 满足具有 

^= e — *(’[ 1+ 為叫 （ 4 . 3 ) 

的上一引理的条件. 

我们利用具有 T = asfH 的不等式 (3.13), 其中常数 a 选取为如此之大，以致 
于对于所有的 A 24| G , ( x )| < ca . 于是 

raVH -7(0 

| F „0 r ) - G ( x )\ < J ^ - - dC + ^. (4.4) 

因为积分域是有限的，所以即使|糾在整个直线上不可积，我们也可以利用 
16.2 节的论证，我们把积分区间分成两部分.第一，因为 F 不是格点分布，所以由 
15.1 节的引理4, | vKC ) l 在《 < KI <肪上的最大值严格地小于1•与 16.2 节一样， 
由此可推出 ICI > Say / H 的贡献比 1/ n 的任何次幂趋于0的速度都快.第二，根据 
对 ICI < ^ 的估计 (2.11), (4.4) 中的被积函数 

< 砝 KI *)， 

从而对于较大的 n , (4.4) 的右边< lOOOe /^. 因为 e 是任意的，所以这就完成了 
证明. ► 

这个论证对格子点分布就失效了，因为它们的特征函数是周期的（从而 ICI > 
的贡献不趋于 0). 尽管如此，这个定理还是可以通过一个考虑到其格子点性 
质的自然重述来 补救. 分布函数 F 是一个阶梯函数,但是我们将用具有折线图形的 
连续分布函数来通近它. 

定义设 F 集中于形如 &± n / i 的格子点上，但不集中于次格子点上（即是 F 的 
步长)_ 

F 的折线逼近 F # 是一个具有折线困形的分布函數，此困形的顶点的横坐标 
为中点6± 且这些顶点位于 F 的困形上. 

因此， 

F # ( x ) = F ( x ), 如果 z = & ± (n + $) / i ; (4.5) 

F *( x ) = i [ F ( i ) + F ( i -)], 如果 x = b±nh. (4.6) 

于是 F „ 是一个步长为 

hn = ^ (4 . 7) 
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的格子点分布，从而对于较大的 n , 折线逼近于很接近于 

定理 2® 对于格点分布，如果把 F „ 换成它的折线逼近巧 6 ,那么展开式 （4.1) 成 

立. 

特别地， （4.1) 在 F „( 步长为 h „) 的格的所有中点上成立，而当把 F n ( x ) 换成 
|[F n (x) + F n (-x)] 

时， (4.1) 在所有格点上成立 • 

证容易看出，逼近和 F 与 -|/» < a : < 上的均匀分布的卷积重合.因 
ilfc , F * 是 F „ 与 ~ h „ < x<\K 上的均匀分布的卷积，我们用 G # 表示这个分 
布与 G 的卷积，即 

广/>»/2 

G *( x ) = h - 1 / G ( x - y ) dy . (4.8) 

J - h n /3 

如果 M 表示 | G "| 的最大值，那么由 G 在钗 x 附近的两项泰勒展开式可以推出 

\ G *( x ) - G ( x )\ < \Mh 3 n = o ( l / n ). (4.9) 

因此，为了证明这个定理，只要证明 

|^( i )- G #(: c )| = 0 (1 A /^ (4.10) 

就够了.因为取卷积相当于把变换相乘，所以我们从 (4.4) 可得 

l ^( x )- G# ㈤ K /_:: n )-7(C) | • K ( C )| dC +^, (4.11) 

其中 Wn ( C ) = / 是均勾分布的特征函数 .（4.4) 所用的估计仍 

可应用，只是现在需要重新证明 

乂^_ |^ n (C/ff«)w„(C)|C _l dC = ^ jT | y > n ( y)ain yj y - 2 dy = o (^) . (4.12) 

①不把换为,我们可以把 F *- F „ 雇开成傅里叶级数，并把它相加便得 (4.1) 的右边.用 
这种方法.我们从形式上得到了埃森用复杂的形式计算 5E 明的定理.例如，见 格涅垫 科和科尔奠戈 
罗夫的著作. 
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根据 15.1 节的引理4,特征函数 p 的周期为 2 n / h , 这对 | sini /» y | 显然也正确.因 
此，只要证明 

J o | v > n ( y )| l/dy = o ($) (4.13) 

就行了.但是，这显然是正确的，因为在原点的一个邻域内 | v »( y)l < 而在 

这个邻域处 lv ( y ) l 大于某一固定的正数，从而 （4.13) 中被积函数比^的任一次幂 
趋于0的速度都快.因此，积分实际上是 0 (1/«). n ► 

我们转向高阶展开式. (4.1) 的证明与 (2.3) 的证明的不同之处在于磨光，磨光说明在 
积分 (4.4) 中取积分限为有限的原因.同样的磨光可以应用于高阶展开式 (2.12), 但是很明 
显，为了得到•个数量级为 n - i r +, 的误差项，我们将必须取 r - anit 1 . 这就产生了一 
个困难. (4.1) 的证明 依賴于 下列事实， k ( C /(« r ^) l 在 ^ v/n < |<| < T 上的最大值小于 1. 
对于非格子点分布，当 T == 时，这总是正确的，但是当 T 与 n 的某个高次幕增加的 
速度一样时就不一定是正确的.因此，对于高阶展开式，我们不得不引入假设 

limsup | v >( C )| < 1. (4.14) 

对于非格子点分布，这个假设蕴含 1^(01 在|<| > <5上的最大值％小于1_利用这个附加的 

假设，对 (4.14) 详细给出的证法可以毫无改变地应用于展开式 (2.2) 且导致 

定理 3 如果 （4.14) 成立，并且矩#*3,存在，邺么当 n -» 00时关于 a : —致地有 

F n ( x )-< Jl - n ( i )^ n - i fc +1 fi *( x ) = o ( n _* r+1 ). (4.15) 

此处札是一个只依楨于 Mi , …，叫，而不依賴于 n 和 t •(或相反，依楨于 P ) 的多项式. 
展开式 (4.15) 只不过是 (2.12) 的积分形式，多项式队和 (2.12) 中的多项式以 

n (®) ft ( x ) = ^ n ( x ) fi fc ( a :) (4.16) 

相联系.因此， 不* 要重述它们的构造.毎个非奇异的 F 都满足条件 (4.14). 

(4.15) 称为 F 的埃奇沃 .5 展 开式. 如果 F 具有所有各阶的矩，那么人们可能要设 
r ^ oo , 但是对任一 n 结果所得的无穷级数不一定 收敛. （克拉美曾证明，为使它对所有的 
n 收敛，当且仅当 ei ** 关于 F 是可积的 •） 形式上的埃奇沃思级数不应和埃尔米特多项展 
开式 

K ( x ) - 9 t ( x ) = ^ c k Jr k ( x ) e ~ i x2 (4.17) 

相 混淆. 当 F 具有有限期望时，上述展开式是收敛的，但是它没有更深刻的概率意义.例 
如，即使可以把每个展开成形如 (4.17) 的级数，系数也不表示收敛 — 91 的速度. 
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16.5 贝利-埃森定理① 

下列重要定理是 A . C _ 贝利 （ Berry )(1941) 和 C . G . 埃森 （ EsseenMWdS ) 发现 
的（他们的证明极不相同). 

定理1 设 Xfc 是具有共同分布尸的独立变量，使得 

E ( X k ) = 0, E ( Xg ) = a 2 > 0, E ( pf fc | 3 ) = p < oo , (5.1) 

并设表示正规和 

(Xi +Xj + --- + X n )/ ay/ri 

的分布.那么对于所有的 a ; 和 n , 

| F n ( x )-« Jl ( x )|^^. (5.2) 

这个不等式的显著特点是，它只依赖丁•前三阶矩.展开式 (4.1) 提供了一个更 
好的渐近估计，但是收敛速度依赖于基本分布的更精确的性质.右边的因子3可以 
换成更好的上界 C , 但在我们这里并不企图得到最优结果 .® 

证证明将以带有 F = &和 G = 91的不等式 (3.13) 为基础.我们选取 

r =基 • ^ (5.3) 

后一不等式是矩不等式 « t 3 < P 的一个推论.[见 5.8 节 ( c ).】 因为正态密度 n 的最大 
值 m <|, 所以我们得到 

⑻- 91 ⑻I < 广 \< P n ( C /^) - + (5-4) 

为了估计被积函数，我们注意到的熟悉展开式可导致不等式 

①本节利用了磨光不等式（3.13)(其中 G 表示正态分布)，但是在其他方面却 S 与上节无关的. 

® 贝利给出了一个界 C < 1.88, 但是已发现他的计算有错误.埃森给出了 C < 7.59. 据说经过未发 
表的计算得到了 C < 2.9(E8seen, 1956) 和 C 彡 2.06(D. L. Wallace 1958). 我们的精简了的方法 
得到了一个非常好的界，它*免了通常凌乱的败值计算.不改进 (3.13) 中的误差项 24m/it, 就不能 
希里有本质上的改进. 
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K-^Knla -^l^^ 1 , 如果 W< 7 ,1^1 <7- (5.5) 

我们对于 a = y>(C/av/H) 和冷= e'KVn 利用上述不等式.从 15.4 节 (4.1) 关于 P 
的不等式，我们有 

卜 ⑷ -1 + 去 <t2 * 2 | =1 /^ (e Kl - 1 一 & + ^V)F{dz } 卜 ip|t| 3 , (5.6) 

从而 

|冰)|<1一 |aV + ^)|t| 3 ， 如果 ^ 2 t a <l. (5.7) 

我们断言，对千 |CI<T, 

I •你 1-^ 2 + 如| 3 

<1_ lfc C2 ^ e ~ A<V "- (5-8) 

因为< P , 所以定理的断言对子< 3显然是正确的，从而我们可以假设 
» > 10. 于是 

WC/ffv^)l n_1 < e-i< a , (5.9) 

右边可以作为 (5.5) 中的界 7 n_1 . 注意到对于 a： > 0,e-*-l + i< ^x 3 , 我们就可 
以从 (5.6) 得到 

+ (長)-『叫 < + (古)_ 1 + £| 

+ n |,_il_ e -icVn| < _C_ |c| 3 + ^ c4 . (5.10) 

因为> 3,所以由 （5.5) 和 (5.9) 可以推出 (5.4) 中的被积函数 

< ?(I <1+ s lc|3 ) e " i<， - ㈣ 

这个函数在 -oo < C < 0O 上是可积的，于是简单的分部积分表明， 

«T|F n (i) - 9l(x)| ^|v^+| + 10. (5.12) 

因为 W < I,所以右边< # < 4 ji ， 因此 （5.2) 成立. ► 

本定理及其证明可推广到具有可变分布的序列 {U 如下. 
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定理 2①设 Xfc 是独立 变量， 使得 

E ( X fc ) = 0, E ( X ^) = 4 , E (| 功)= 办. (5.13) 

令 

4 =4 + ••• + 4， r n = Pi + ••• + />»»， (5.14) 

用 _ F „ 表示正规和 （Xi + .M + XJ / sn 的分布， 那 么对于所有的 x 和 n , 

| F „ ⑻-饥⑷…篆 (5.15) 

证如果叫表示的特征函数，那么开始的不等式 (5.4) 现在应换成 

獅)-驟 £■ h (去 X ) - e H ( 5 . ifl ) 

这次我们选取 



代替 (5.5), 我们现在用当 |办| < 7 fc 和 I 汍 I < 7* 时成立的不等式 

| o：i … a n _ 负 …/3„| 彡 E 71 …7*-1叫 -/ Sfc 7 fc+i … 7 n . (5.18) 

fc=i 

这个不等式将被应用于 _ 

a k = a； fc (C/«„),/3fc = |C| < T . (5.19) 

按 (5.8) 类推,我们有，若 < s„v/5, 则 

MCAn)Kl-i^C 2 + 為 _ Kl 3 < exp (-義 + 穿吾) < 2 . (5.20) 

为了得到一个对一切 fc 都适用的界 7fc, 我们把系数 | 换为 f 并令 

7k = eXp (~^ + g^ ： ) C2 - (521) 

①应归功于埃# (他的证明方法与我们完全不同). 
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显然，|办| < 由 （5.20) 知，对于使得 cifcT < | s „ 的 fc 也有 | a fc | < 7 fc . 但是， 
由矩不等式件 > 4可以推出，如果办7 1 > | s n , 那么 7 * > 1. 从而对于所有的 
*,|ofcl <7 fc - 

当 (5.15) 的右边> 1时即 r n /«3 彡^时，本定理显然成立.因此，我们今后假 
设 rjs 3 n < | 或 T > &的最小值在某一使 cr k /8 n < 4/3 T < ^的 fc 上达到，从 

而对于所有的 *,7* ^ e -< V 32. 于是最后有， 

hi . "7 k - i 7 *+i …7”| 彡 expC 2 (- ■ + + < e ~ <3/8 . (5.22) 

按 (5.8) 类推，我们可得 

^2 1«* -/3*| < gp - lCl 3 + ^ X ! (5-23) 

fc=i n n fc=i 

为了估计最后这个和，我们回忆^ < p ! < 4 - Pk , 从而 

去自心设)、垚 s 喝. _ 

这些不等式表明， (5.16) 中的被积函数 

< ^ (^ 2 + ^ ICI 3 ) e_ca/8 . (5.25) 

从而最后有 

nT | F „0 c ) - 9 I ( i )| <，㊈ + A . 6 4 + 9.6. (5.26) 

右边 < 16 ji /3, 因此 (5.26) 菹含 (5.15). p . 

现在人们非常注意贝利-埃森定理向无三阶矩的变摄推广，于是上界被换为 
分数矩或某一有关的 M . 卡兹 （ M . L . Katz )(1963) 在这个方向上迈出了第一步■通 
常的计算是凌乱的，一直没人努力去寻找适用于各种变形的统一 方法. 我们的证明 
就是为此而给出的，并且为使它包括更广的范围，可以重新予以叙述.实际上，三 
阶矩在证明中的出现只是由于利用了不等式 

| e ite - 1 - ito + | t 2 i 2 | < ^| ti | 3 . 

实际上只须在某一有限区间 W < a 上利用这个估计，在其他情况下用界 t 2 # 就足 
够了. 这样我们就可得到下列奥西波夫 ( L . V . Osipov ) 和彼得罗夫 ( V . V . Petrov ) 用 
其他方法得出的具有未定常数的定理. 
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定理3 假设定理2的条件成立（除了三阶矩不一定存在外)，那么对于任意的 

n > o , 

|^n(x) -«n(x)K6(8- 3 f |x| 3 F{di} + a - 3 f ) . (5.27) 

\ J\x\>T k ) 

利用简单的截尾法，我们可以把这个结果推广到没有矩的变 M 上 .® 


16.6 在可变分量情形下的展开式 


16.2 节和 16.4 节的理论容易推广到具有可变分布 C 4 的独立变 遣序列 { X k } 
上.事实上，我们的记号和论证就是为此而准备的，因而不总是最简单的. 

设 E ( X fc ) = 0和 E { Xl ) = a \. 我们照例令4 = 4 +…+ <• 为了保持连续性， 
我们仍设 A 也表示正规和 ( X 1 + --- + X n )/ s n 的分布. 

为了让概念确定起见，我们考虑一项展开式 (4.1). 左边现在有显然的类似表 


( 6 . 1 ) 


( 6 . 2 ) 

在相等分极的情形下已证明了 D n ( x ) = o(l/y/n). 于是 £)„ 是各个误差项之和，在 
现在的情形下，这些误差项不一定有可比较的数 M 阶.亊实上，如果 Xfc 有四阶矩， 
那么可以证明，在较弱的附加条件下， 

|£>„0«0| = 0(n 2 8~ 6 ) + 0(n«~ 4 ). (6.3) 

此处这两项中哪一项占优势，取决于序列 ns； 3 的性质，这序列可以在 0 和 oo 之 
间 变动. 从理论上讲，可以求出误差的泛界,*但是在实际中产生的各种特殊情况下 

①关于細节见 W. Peller, On Berry — Egseen theorem , Zb . Wahrscheinlichkeitstlieorie verw. 
Gebiete, vol. 10(1968) pp.261-268. 出乎意料的是.即使在古典的情形下，统一的一般方法实际 
上也簡化了论证，而且不难导致更奸的数值估计. 

® 例如在克拉美基本理论中，界具有下列形式， 

Dn ( x )=0 («k 8 (矣 E(xj)) 3 ) . 


其中 


D „( x ) = F n (*)-9 l ( x )-^ n ( I ), 
/4 n) = ^E(Xf). 


这可能比（6_3)更坏. 
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这样的泛界非常凌乱且极难求出.因此，较慎重的是只考虑具有一些典型性质的序 
列 { X k }, 但是要使证明如此灵活，以致在各种情况下都能应用 • 

作为典型的模型，我们考虑这样的序列，使得比 g / n 界于两个正数之间 ® .我 
们将证明，在较弱的附加条件下展开式 （4.1) 仍然成立，它的证明无需改变.在其 
他情况下，误差项可取不同的形式.例如，如果4 = oW , 那么只能有 | D „(*)| = 
o ( n / al ). 但是，证明可适用于这种 情况. 

(4.1) 的证明依赖于取 D n ( x ) 的傅里叶变换.如果叫 表示 X k 的特征函数，那 
么这个变换可以写成如下形式： 

e nv n ((M _ e - iC a _ 2^ M C 3 e - Jc a , (6.4) 

其中 „ 

Un (0 = n ' 1 In w fc ( C ). (6.5) 

fc=i 

于是，这恰好与 (4.1) 的证明中所用的形式相同，所不同是在那里 w „(0 = In 9(0 
与 n 无关，现在我们来看此式对 n 的依赖性怎样影响证明.这里只用到 t ; 的两个 
性质. 

( a ) 我们利用三阶导数 〆 "的连续性来找一个区间 （| C | < J ), 使得在此区间内 
v ' J ： 的变化小于 e . 为了保证这个 <5的选择可以与 n 无关，在原点附近加一个关于 
导数 <4〃 的一致性条件.为了避免无趣味的技巧性讨论，假设矩 E ( X *) 存在且有 
界.于是， c ^〃 具有一致有界导数，这对^也成立. 

( b ) (4.1) 的证明依赖于如下事实，对于所有的 C > J 一致地有 |<^ n ( C)l = 
o ( l / y / n )- 于是类似的事实是： 

在（>«5>0上一致地有， 

| wi ( C ) • ■ • w „( C )| = o ( l / y / ri ). (6.6) 


这个条件排除了这样的可能性，即所有的 X fc 具有相同步长的格子点分布.（在这 
种情形下， (6.6) 中的乘积是 C 的周期函数 •） 另外，条件是如此之低，在大多数情 
形下都被满足.例如，如果 X * 有密度，那么所有的因子 | w fc | 取1以外的有界值， 
而且除非 | w „( C )| — 1(即趋于集中于一点上)， (6.6) 的左边比 1/ n 的任何次幕 
趋于0的速度都快.因此，一般情形下，以下这个较强的条件是满足的，并且对于 
a >0 情形是容易验证的< 


①于是， （6.3) 给出 |D„ ㈤ | = 0(l/n), 这比 (4.1) 中所得剌的界更精确.之所以期得到这个改进， 
是因为有四阶矩存在这个 傾设. 
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w „( C )| = o ( n -°) 在 （ > <5上一致 成立. (6.7) 

在上述两个假设下， (4.1) 的证明可以毫无改变地照搬过来，于是我们有 
定理 1 伋设对子所有的 n 和某些正常數有， 

cn < sl < cn , E ( X ^) < M , (6.8) 

且 (6.6) 式成立，則对于所有的 a ; —致地有 

| D „(*)| = o { l / y / n ). 

如前所述，这个证明可适用于其他 情形. 例如，假设 

a*/n —> 0，但 s®/n — » c ». (6.9) 

令 T = ag / n , 则 (4.1) 的证明可照搬过来.因为 T = 〆 《„)，所以条件 (6.6) 就成为 
不必要的，这样我们得到下列的变形. 

定理 la 如果 (6.9) 成立，并且 E ( X ^) 是一致有界的，那么关于 * 一致地有 
Pn ( i )| = o ( n / al ). 

16.2 节和 16.3 节的其他定理可以用同样的方式进行推广.例如， 16.4 节定理3 
的证明不经本质上的改变就可导致下面的一般展开定理 .® 

定理2 假设 （6.7) #a = r + l 成立，且 

0<c<E(|Xn <C<oo, i/ = l, …， r + 1, (6.10) 

則渐近展开式 (4.15) 关于 a : —致成立 ■ 

多项式氏依赖于 (6.10) 中出现的矩，但是对于固定的 a :， 序列是有 
界的. 

16.7 大偏差® 

我们从具有共同分布 F 且使得 E ( X k ) = 0， E ( Xg ) = d 的特殊情形开始考虑我 
们的一般问题.与以前一样，凡表示正规和 （& + ■•• + X n )/< Ty / H 的 分布. 于是 F „ 
趋于正态分布仇这个结果对 a : 的适当的值是有价值的，但是对于较大的 x , F n ( x ) 
和饥 Or ) 都接近于1，中心极限定理就没有意义了.类似地，大多数展开式和通近就 
成为多余的了.我们需要一个以1-91逼近1-仏的相对误差估计，我们将多次利 
用在 a : 和 n 两者都趋于无穷情况下的关系式 

①在稍为弱一点的一致性条件下，这个定理已包含在克拉美的先明著作中.但是克拉美的方法巳经过时. 
® 本节内容与本章前面各节无关. 
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1-- F n ( x ) 
1 - < Jl ( x ) 


(7.1) 


这个关系式一般说来不成立，因为对于对称的二项分布，分子对于所有的 x > 
等于 0. 但是我们将证明，如果 a ： 随着 n 变化， 使得; c — 00 ,且 xn~i ^ 0,那么 
(7.1) 成立，只要积分 

m = J _^^ F { dx } (7.2) 

对某个区间 id < &上的所有 c 都存在.[这相当于说，特征函数 we ) = zoo 在原 
点的一个邻域内是解析的，但是最好处理实函数 /. 1 

定理 1 如果积分 （7.2) 在原点附近的某个区间内收敛，且 a ; 随着 ri 这样变化，使 
得 ! c — 且 ar = o ( ni ), 那么 (7.1) 成立 • 

把 a ; 换成 - a :, 我们得到关于左尾部的对偶 定理. 大概此定理相当一般，足以 
包含“具有实际价值的一切情况”，但是证明方法可导致更强的结果. 

为了证明，我们不讨论/而讨论它的 对数. 在原点的一个邻域内， 

^(0 = ln /( C ) = E ^ C fc (7.3) 


确定了一个解析函数.系数也只依赖 T 分布 F 的矩并称为 F 的阶 
半不变 量.一般说来 ， A = = <7 2 , …. 在现在的情形下，糾= 0,因此岭1 = 

0,il>2 = cr 2 ,^ = 

证明是以相伴分布的技巧为基础的 .® 我们把分布 F 和这样的一个新概率分布 
V 联系起来，使得 

V^dx} = e-^e^Fidx}, (7.4) 

其中参数《是在的收敛区间中选取的.函数 


«(0 


f(C + ») 

~JW 


(7-5) 


对 K 所起的作用和/对原来的分布 F 所起的作用相同.特别通过微分 （7.5) 可推 
出 V 的期望为 作)， 方差为 V { s ). 

证明的思路现在可以粗略地说明 如下： 容易从 （7.4) 或 (7.5) 看出，分布 
和又有关系式 (7.4), 所不同的是现在应把正规化常数换成.把 
这个关系式反演，我们得到 

1 - F n ( x ) = 1 - ^( xay / n ) = e "*(*) j 二 e ^^ idy }. (7.6) 


①它曾应用于 11.6 节更新理论和 12.4 节随机游动. 
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由中心极限定理，在这里似乎自然可以把 V "*换成相应的期望为 nr ^' is ), 方差 
为 r #〃( s ) 的正态 分布. 如果下积分限接近于 V n * 的期望，即 I 接近于 rl /( s ) y / ii / a , 
那么这个逼近中产生的相对误差很小.这样我们可以对； c 的某些较大的值推导 
1 - F n ( x ) 的较好的近似，并且 （7.1) 就在其中. 

证在原点的一个邻域内，4是具有形如 

V >( S ) = 1 + ^( T 2 8 2 + ^/ x 3 s 3 + ••• (7.7) 

的幂级数的解析函数，於是一个满足 ^(0) = 0的凸函数，从而对 a > 0是递增的. 
因此，只要把 s 和 x / v ^ 局限于原点的一个适当邻域，关系式 

yfn^f ( s ) = ax , s > 0, x > 0 (7.8) 

就在变贵 s 和： r 之间建立了一一对应.每个变世都可看作是另一个变董的一个解 
析函数.显然， 

如果滠 — ㈣ 

我们分两步进行 • 

⑷我们首先计算把 （7.6) 中的换成具有相同的期望 n ^>\ s ) 与相同 的方 
差 nV »"( s ) 的正态分布所得的世人.利用标准的代换 y = n 少⑷+ ty /^ ns ) 可得 

A a = e n _ W (*) l ^= 厂 e - t . v ^ w - it a df (7.10) 

在指数中平方，我们得到 

A , = exp - si //(8) + ) • |1 - 9 l ( s \/ nV ' ,, («))]. (7.11) 

指数及其前二阶导数在原点上等于 0, 从而它的幂级数从三次项开始.于是 

A , = [1 - * n («^/ nV > ,, («))] - [1 + 0( ns 3 )], s -♦ 0. (7.12) 

如果 ns 3 — 0,或者换一个说法，如果 z = o ( ni ), 那么我们可以把 （7.12) 改写成形 
式 

A t = [ l - 9 l ( i)][l + 0( x 3 / v ^]- (7.13) 

为了简单起见，我们令 

X = s->ywp"(s). (7.14) 
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剩下的只要证明在 (7.13) 中我们可以把 i 换为 a : 就行了•味- x )/ n 的幂级数与 n 
无关，简单的计算说明它从三次项开始.因此， 


|x - *| = 0( v ^ ns 3 ) = 0( i 3 / n ). 

(7.15) 

我们由第 1 卷 7.1 节， (1.8) 可知，当 f — oo 时， 


1 - 9 l ( t ) 

(7.16) 

在 x 和 * 之间积分，我们得到，当 a: - 00 时， 


卜 1 - 9l(ij 1 _ 外 • 叫)= 0(x A /n), 

(7.17) 

从而 

代入 (7.13), 我们最后得到，如果； c — oo 使得 I = o ( ni ), 那么 

(7.18) 

A , = [ l - OX(®)][l + 0( i 3 / VJi )]. 

(7.19) 

( b ) 如果凡 表示期望为 nil/(a), 方差为 nr(s) 的正态分布，那么九表示当 
把 V "*换成 9 l a 时 (7.6) 的右边.我们现在来估计由这种代换所产生的误差.根据 
贝利-埃森定理(第5节)，对于所有的 y , 

\V n *(y) - 饥，( 1 /)| < 3 M . a - 3 / Vn , 

(7.20) 


其中 M a 表示分布 F 的三阶绝 对矩. 因此，经过简单的分部积分后可以看出， 

I 1 - 凡 W _ 小 為"* (,) 卜 W + ■ £(■) e—H 

= (7.21) 

但是根据 （7.11), 

A ,= e "W«)-OM -e^ll- 饥⑻卜 (7.22) 

从而 (7.21) 的右边是土. 0 { x / y / n ). 于是 

1 - F n { x ) = i4,[l + 0 { x / y / ri )]. (7.23) 
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与 （7.19) 结合起来，这不仅证明了本定理，而且还证明了更强的 
系如果 *-» oo 使得 a : = o ( r »4), 那么 

匕 ti= 1 + 0 ㈤. 网 


我们间接地推导出了一个更进一步的结果.当 a ： 随着 n 这样变化，使得 ： c — 00但是 
x = o ( Vn ) 时就可应用此 结果. 实际上，根据 (7.23), 我们此时有1 - F n ( i ) ~ A., 其中4, 
由 (7.11) 给出.此处91的自变量是 A 但是 (7.18) 表明至可以换为 a :, 因此，我们得到一 
般的逼近公式 

1 - F„(*) = exp (n 卜 (a) - sV>’(a) + 

•[l-9t(x)](l + 0(i/VJi)]. (7.25) 

指数是一个 s 从二阶项开始的幕 级败. 和在 (7.8) 中一样，我们现在用^(«) = «定义一 
个变世 2 的解析函数 s . 对于这个函败，我们定义-个幂級数 A , 使得 

z a X(z) = Ai « 3 + Xaz 4 +■•• = tp(x) — arl>\a) + | i / i , a ( s ). (7.26) 

利用这个级数，我们有 

定理 2 ①如果在定 * 1 中把条件 a: = o(n*) 換成 * = o(y/n), 那么 

= exp (* a A ⑸) [1 +0 (*)] • (7.27) 

特别地，如果 a : = 0 ( n i ), 那么在幂级败中只有第-项起作用，我们得到 

i-«(x) 〜 —( 菩 )， Al = 0' _ 

当 * = 时，我们得到 

1-^»(*) x 3 . . x 4 \ . - 3^? . 

y-^-exp^A.-^+Aa-J, A a = ^ , (7.29) 

①把变换 （7.4) 应用到与中心极限定理有关的问 *, 似乎应归功于 F. 埃斯切尔 (Eeecher) (1932). 
本定理应归功于克拉美 (1938), 并被费勒 (1943) 推广到可变分* 上去. 关于这方面的较新结#，见 
V. V. Petrov, Uspekhi Matem. Nauk, vol.9(1964)( 俄文版）和 W- Richter, Local limit theo ¬ 
rems for large deviations , Theory of Probability and Its Applications (译文), vol.2 (1957) 
pp.206-220. 后 一作者讨论的是密度而不是分布.关于导致形如1 - F„(x) = exp[t.(i) + o(«(i))] 
的逼近的另外一种方法，见 W. Feller, Zs. Wahrscheinlichkeitstheorie verw. Gebiete vol.14 
(1969) pp.1-20. 
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等等.应注意到，右边可以趋于0或00,从而这些公式并不蕴含1 - ■ FWOt ) 和1 _ SH ( a :) 的 
渐近等价性.只有当 * =咖 i) 时（或者在三阶矩等于 0 的情形下，当 x = o { ni ) Bt) 才存 
在这一等价关系.在任何佾形下，我们有下列有趣的 
系如果 a : = o (>/ n ), 那么对任_ e > 0,最终有 

exp(-(l + e ) i a /2) < 1 - F n ( x ) < exp(-(l - e ) x 2 / 2 ). (7.30) 


上述理论可以推广到包含具有可变分布和特征函数的随机变董 Xfc 的部分 
和的情形.这个程序可以用定理1的如下推广来说明，在定理1中一致性条件太强. 
其中仍表示正规化和 ( X 1 + -.. + X n )/ s n 的分布. 

定理3假设存在一个区间使得所有 特征* 數 w * 在其中是解析的，并飯设 
E ( IX „ I 3 ) < Ma 2 n , (7.31) 

其中 M 与 ri 无关.如果和 a : 桉这样的方式趣于 oo , 使得1 = 那么有 

l--Fn(x) , 

1 - m(x) ' 

误差为 o (* 3 / s „). 

证明是相同的，只是现在要把 V ；换为对 -a < s < a 由 
1 " 

少 ”(《) = -^lnw fc (-ia) 

n fc=i 

定义的实值解析 函数. 在形式计算中，现在用 a ： S „ 代替 xa ^ i . 基本方程 （7.8) 呈 
1p'n(8) = XS n /Tl 的形式 • 


(7-32) 


(7.33) 



第 17 章无穷可分分布 


本章讨论概率论的古典极限定理的核心内容——无数多个知识的小溪和发展 
汇成的知识宝库.这个主题的最经济的论述是从 17.7 节所述的三角形阵列开始，但 
是我们还是从简单的特殊情形开始，以便容易理解各种重要的课题. 

无穷可分性、稳定性等概念及其直观意义曾在第6章中讨论过.本章的主要结 
果曾以不同的形式、用不同的方法在第9章中导出过，但是本章的讨论将更详细 
些.它是自给自足的，并且可以作为第15章（特征函数）的续篇来进行学习，它与 
前面各章无关. 


17.1 无穷可分分布 


我们沿用习惯做法，利用对分布及其特征函数可交换的描述性术语.按照这种 
理解， 6.3 节中给出的无穷可分性定义可以重新叙述如下. 

定义 特征 A 數 u ; 是无穷可分的，当且仅当对于每个 n , 存在一个特征函數 
使得 

< = w. (1.1) 


我们将很快看到无穷可分性可以用其他性质来刻划，这说明为什么这个概念 
在概率论中能起重要的作用. 

关于特征函数的根与对数的注 人们可能很想把 (1.1) 中的称为 w 的 n 次 
根，但是为使这个说法有意义，我们需要证明这个根在本质上是唯一的.为了在复 
域上讨论根与对数的不确定性，从复数 a ^ O 的极坐标表达式 a = re ie 开始将 
是很方便的.正数 r 是唯一确定的，但是只有当把任意两个差为 2 J ! 的整数倍的数 
看作一样时，辐角才是确 定的. 原则上讲，这种不确定将被 lna = lnr + W 和 
a l/n = r l/n e iO/n 所继承 （此处 r Vn 表示正根 ， In r 表示普通的实对数).虽然如此， 
但是在使 w(C) # 0 的任一区间 ICI < Co 内，特征函数 w 有唯一的极坐标表达式 
w(C)= rCC)-^), 使得 0 是连续的且 0(0) = 0. 在这样的区间上，我们可以明确地 
记 lnu;(C) = lnr(C) + i 6{(： W /n (0 = 这些规定是使 lnu; 和 w 1 /" 为 

连续函数且在 C = 0 时为实数的唯一 规定. 在这个意义上， lna ; 和 w 1 /" 在不包含 w 
的聿点的任一区间 | C | < <o 内是唯一确 定的. 我们将只在这个意义上利用符号 lnw 



17.1 无穷可分分布 497 


和 w 1 /", 但是必须记住，一旦 w(Co)=0, 这个定义就无法使用 了①. ► 

设 F 是任意一个概率分布，是它的特征函数.由 15.2 节， (2.4) 我们知道， _F 
产生一族具有特征函数的复合泊松分布 

e ~ c fli Fk * - d-2) 

fc =0 

此处 C > 0 是任意的.显然， w = e^- 1 ) 是无穷可分的（因为根 W 1 /" 与 w 的形式相 
同，所不同的只是要把 c 换为 C /n). 正态分布和柯西分布表明，无穷可分分布不一 
定是复合泊松类型的，但是我们现在将证明，每个无穷可分分布都是一个复合泊松 
分布序列的 极限. 整个理论的基础是 

定理1 设 {^n} 是一个特征函數序列.为使存在一个连续的极限 


w(0 = 

(1.3) 

当且仅当 


咖 n(C) — V>(0 ， 

(1.4) 

其中少 是连蠄的.在这种情形下， 


w = e -*. 

(1-5) 


证我们回忆一下 15.3 节中的连续性定理.如果一列特征函数收敛于一个连续函 
数，那么后者是特征函数，并且收敛性在每个有限区间上自然是一致的. 

(a) 我们从定理的较容易的部分开始.假设 （ 1.4) 成立，其中 0 是连续的.这组 
含对于 C,¥»n(C)-l. 并且收敛在有限区间内自然是一致的.这就是说，在任一区间 
ICI < G 内，对于充分大的 n 我们有 |1- 伽 (C)| < 1. 其次，对这样的由 hi(l 
的泰勒展开式可知， 

nln^n(C) = »ln(l - [1 - V>n(C)]) 

= -n[l - v3„(C)] - ^[1 - Vn(C)] 2 - (1-6) 

由 （1.4) 知，右边第一项趋于-■，因为 外 (0 — 1,所以这蕴含所有其他的项都 
趋于 0. 因此， nln V „--^ 或者 — e-*, 正如所断言的那样. 

(b) 如果已知 (1.3) 中的极限 w 没有零点，那么其逆同样也是很简单的.实际 
上，考虑任一有限区间 |C|<Ci. 在这个区间内， （1.3) 中的收敛是一致的， w 没有零 

①在 15.2 节的末尾（以及在 15.9 节的习 • 9中)，我们求出了一对实特征函数，使得4 d .这 
说明在有零点的情形下，实的價特征函败可以具有2个实根，且这2个实《也是特征函数. 
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点蕴含对于所有充分大的 n , | C | < C , 有 ^ n ( C ) # 0. 因此，我们可以取对数，并断言 
nlrupn -+ lnw , 从而 lnp „ — 0. 这道含对于毎个固定的 C .^ nCC ) 1. 且收敛在每 
个有限区间内自然是一致的.因此，和在⑷中一样，我们断言展开式 (1.6) 成立， 
因为 


1 — ¥> n (0 0, 


所以这蕴含 


nln^ n (C) = -«[1- Vn ( C)](l + 0(1))， （1.7) 

其中 O ⑴表示一个当 n ^ oo 时趋于0的量.由假设，左边趋于 ln W ( C ), 从而显然 
有 n[l - ip „] -* - lnw , 正如所断言的那样- 

为使这个论证成立，我们必须证明对于任一 C ,^(0 都不等于0,为此，我们 
可以分别把 w 和％换为特征函数 M 2 和 | v >„| 2 , 从而只要考虑 (1.3) 的如下的 
特殊情形就够 f . 在这种情形中，所有的都是实数，且> 0. 其次，设 
ICI < 0是使 w ( C ) > 0的 区间. 在这个区间内， - In 以 (0 是正的且是有界的.另 
一方面，对于 ICI < Ci ， 展开式 （1.6) 成立，因为所有项的符号都相同，所以对于 
Kl < Cx , n [ l - Vn ( C )] 是有界的.但是根据 15.1 节 （1.7) 特征函数的基本不等式有 

n[l - Vn (2 <)l ^ 4 n[l -外(01， 

从而 n|l - < p n ( 0 ] 对所有的 ICI < 20是有 界的. 由此推出这个区间不可能含有 w 的 
零点.但是这样的话，最初的论证适用于这个区间，并导致一个结论，对于所有的 
ICI < 4 C !, u .( O >0. 按上述方法继续进行，可以证明对于所有的 CM 0 > 0,这就 
完成了证明. ► 

定理1有许多推论.用《 > 0乘 (1.4), 可以看出这个关系式等价于 

e tnlv.»(C)-ll _» e t¥-(0 = ⑹. (1.8) 

左边表示一个复合泊松型分布的特征函数，因此对于每个 f > 0, e ^( C ) 是一个特征 
函数. 我们断言 ， w = 一定是无穷可分的.换句话说，作为特征函数序列{《}的 

极限出现的毎个特征函数 u ; 都是无穷可分的.这可以看作是无穷可分性定义的一种 
扩展，其中把恒等式 (1-1) 换为更一般的极限关系式 （1.3) .在 17.7 节中将看到，这 
个结果可以进一步推广到更一般的三角形阵列上去，但我们先把初步的结果写成 
定理2 为使特征函數 u ; 是无穷可分的，当且仅当存在_个特征函数序列 
使得 戒 — w . 

在这种蜻形下，对于每个 f > 0,0；* 是一个特征函数，并且对于所有的 <,w(C) ^ 
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系 无穷可分特征*數序列 { w n } 的连续极限仍是无穷可分的. 

证由假设，％ = wi / n 仍是特征函数，从而关系式 — U ； 可以改写成抑 — 0； 
的形式. ► 

每个复合泊松分布是无穷可分的.定理1告诉我们，每个无穷可分分布可以表 
示为一列复合泊松分布的极限[见满足 t = 1的 （1.8)1. 这样我们得到了无穷可分性 
的一个新的特征. 

定理 3 无穷可分分布类和复合泊松分布的极限分布类重合. 

在独立增*过程中的应用正如 6.3 节中所说明的那样，这样的过程可以用具有如下性质 
的随机变 fi 族 { X ( t )} 来描述：对于任一分划 to <ii < • • •<«», 诸增量表 
示 n 个相互独立的变量.增量是平稳的，如果 X ( a + t )- X ( a ) 的分布只依 赖丁区 间 的松度 t 
而不依赖于它在时间轴上的位置.在这种情形下， X{a+t)-X(.t) 是 n 个与 X(a+t/n)-X(a) 
有 相同分布的独立变量之和，从而 X(a + t )- X ( a ) 的分布是无穷可分的. 反之，任一族具有 
形如 e 〜的特征函数的无穷可分分布可以规定•个平稳独立增量过程 .17.7 节中关于三角 
形阵列的结果可以把这个结果推广到具有非平稳独立增量的过程.于是增量 X{t+8)-X{ 8 ) 
是诸增搋 X(t k+1 ) - X{t k ) 之和，这些增量是相钇独立的随机变量.只要在当 fc — 0 B 才增 
量 X(t + fc )- X ( t ) 依概率趋于零的意义上过程是连续的，就可应用 17.7 节的定理.对于这 
样的过程,增量 + X ( t ) 的分布是无穷可 分的. （这种类型的不连续过程是存在的，但 
是不连续点并不足道，并且在某种意义上是可除去的.见 9.5 节和 9.9 节中的讨论 .） 

复合泊松过程有特别简单的概率解释（见 6.3 节和 9.5 节)，每个无穷可分分布可作为 
复合泊松分布的极限出现这个事实，可以帮助我们理解更一般的独立增量过程的性质. 


17.2 标准型，主要的极限定理 

我们已经看到，为了求出无穷可分特征函数 uj = e ^ 的最一般形式，只需确定 
复合泊松型特征函数 expc „( C n - 1) 的序列的可能的极限的一般形式就够了.为便 
于各种应用，最好通过允许任意的定中心来更一般地叙述这个问题，从而我们要寻 
求形如 u ;„ = e 夂的特征函数的序列的可能的极限，其中为了简单起见，我们令 

^n(C) = Cn[¥>n(C) iA»C]- (2.1) 

是无穷可分的，因此它们的连续极限也是无穷可分的. 

我们的问题是寻找这样的条件，使得在这些条件下存在一个连续的极限 


矽 (0 = 


( 2 . 2 ) 


不言而喻，是一概率分布的特征函数，〜是正常数，中心 常数久 是实数. 
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对于期望存在的分布，自然要这样定中心，使得期望为0,如有可能，我们将 
照此选择氏.但是我们需要一个具有类似性质的普遍可用的中心常数.结果是，这 
种最简单的中心常数可通过下述要求 得到， 对于 C = l , V „ 的值是实数.如果 u „ 和 
Vn 表示屮 n 的实部和虚部，那么我们的条件要求 

A* = «n(l) = J sina : F n { da :}. (2.3) 

这说明我们的定中心方法总是可行的.对于这种定中心方法， 

^ n ( C ) J t ei< * — 1 - K sln *] F n { dx }. (2.4) 

被积函数在原点附近与 ~ C 2 x 2 有相同的性质，这和我们所熟悉的定中心定在期望 
为0的情形一样.中心常数 （2.3) 的用处多半是由于如下的. 

引理1 设 { c „} 和 {< p n } 是给定的.如果存在中心 常数凡 ，使故„寿于一个连续的 
极限也那么 (2.3) 可达到同样的目的. 

证用带有任意 A •的 (2.1) 来定义么，假设 v *„ — 岭.如果6表示训 1) 的虚部， 
那么对于 C = 1,我们断言 

Cn(v n (l) - 0n) -*b. (2.5) 

用 i < 乘以上式并从中减去刚才所得到的关系式，我们看到 

Cn kn(C) - 1 - iVn(l)C] — 矽 (0 - 札 (2.6) 

这就证明了断言. ► 

我们首先在一个特殊情形下讨论我们的收敛性问题.在这种情形下，解特别简 
单. 假设函数和0都是二次可微的（这就是说，相应的分布的方差存在，见 15.4 
节).假设不仅有 A — 也而且还有< —f •由 （2.1) 看来，这就是说 

Cn jf + °° e l < VF n { di } ^ - rp "(0- (2.7) 

根据假设， C„X 2 F n {dx} 确定一个有限测度，我们用表示它的总质量.对于 C = 0, 
我们从 (2.7) 可看出 /*„ -* -少'⑼.用〜除 (2.7), 在左边我们得到一个正常概率 
分布的特征函数，当 n -> oo 时它趋于 ^(0/^(0). 由此推出 f [ CW '(0 ) 是一个 
概率分布的特征函数，从而 

-，(<) = 


( 2 . 8 ) 
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其中 M 是一个有限测度.由此我们可以通过累积分得到办注意到例 0) = 0,以及 
对于我们的定中心条件，矽⑴必须是实数，我们就可得到 

攸 )= /: ㈣. ㈣ 

这个积分是有意义的，因为被积函数是在原点处取值 -$c 2 的有界连续函数. 

在我们的可微性条件下，极限必必然具有 (2.9) 的形式.其次我们证明，对于 
—个任意选择的有限测度 M, 积分 (2.9) 定义了一个无穷可分特征函数但是， 
我们可以再深入 一步. 为使积 分有意义 ,不必要求测度 M 是有限的.只要 M 对有 
限区间賦予有限质 M, 并且 M{=^x} 增加的充分缓慢，使得对于所有的 a: > 0,积 
分 

M+(*) = J y- 2 M{dy),M-(-x) = j y~ 3 M{dy} (2.10) 

收敛就行了.（为了确定起见，我们取积分区间为闭的 •） 由满足0 < p < 1的密度 
\^\ p dx 确定的测度是典型的例子.我们证明，如果测度 M 具有这些性质，那么 (2.9) 
定义了一个无穷可分特征函数，并且所有这样的特征函数都可以用这种方法得到. 
因为对我们的测度引入一个专门术语将是很方便的. 

定义 1 —个測度 M 称为标准的，如果它对有限区间賦予有限 质量， 并且积分 
( 2 .10) 对于某一（因而所有的 )a:>0 收敛. 

引理 2 如果 M 是一个标准測度，且分由 (2.9) 确定，那么 e* 是一个无穷可分特 
征函数. 

证我们考虑2种重要的特殊情形. 

⑷假设 M 集中于原点上，且对原点賦 予质鲞 m > 0.于是辦0 = -mC 3 /2, 
从而#是一方差为 m- 1 的正态特征函数. 

(b) 假设 M 集中于 |a;| > 上，其中> 0. 在这种情形下， (2.9) 可以改写成更 
简单的 形式. 实际上， x- 2 M{da:} 现在确定一个总质量为 M = M+ ⑻ + M- ⑻的 
有限测度.因此， x~ 3 M{dx}/n = F{dx} 确定一个特征函数为 p 的概率测度，显然 
矽 (0 = Mb(C) - 1 - i6Cl, 其中&是实 常数. 于是在这种情形下#是复合泊松型特 
征函数，从而是无穷可分的 • 

(c) 在一般情形下，设 m > 0是 M 賦予原点的质量，令 

~^ iC，i ° lM(dl) ' (2 . U) 


于是 


V »( C ) = - yC 2 + 


(2.12) 
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我们巳经知道，是一个无穷可分分布的特征函数.如果 m > 0,那么把 
- mC 2 /2 加到 ^(0 上去相当于取 R 与一个正态分布的 卷积. 于是 (2.12) 把#表 
示为一个无穷可分特征函数序列的极限，因此#是无穷可分的，正如所断言的那 
样. ► 

其次我们证明，在不同的标准测度产生不同的积分的意义上，表达式 （2.9) 是 
唯一的. 

引理3矽的表达式 （2.9) 是唯一的 • 

证在测度 M 有限的特殊情形下，显然二阶导数少'存在，且-，⑹和关 
于 M 的期望重合.特征函数的唯一性定理保证 M 由少 '， 从而由 V * 唯一地确定. 

这个论证可适用于无界的标准测度，但是必须把二阶导数换为一个具有类似 
性质且适用于任意连续函数的 运算. 这样的运算可以用各种各样的方法选择（见习 
题1〜习题 3). 我们选择一个这样的运算， 它把分 变换成下式确定的函数 於*: 

^*( C )= V >( C)-^^%(C + s ) ds , (2.13) 

其中 A > 0是任意固 定的. 对于 (2.9) 所确定的函数也我们得到 

於 *(0 = J°° e l(x K(x)M{dx], (2.14) 

其中为了简单起见，我们令 

K(x) = x~ 2 [l - 与约 • (2.15) 

这是一个在原点取值/» 2 /6的严格正的连续函数，并且当 x -»± oo 时我们有 K ( x )^ 
X- 2 . 因此，由= K(x)M{dx) 所确定的测度是有限的， (2.14) 说明★是 
它的傅里叶变换.根据特征函数的唯一性定理，唯一地确定测度 M *. 但是这 
样 M{Ax) = K- l (x)M*{dx) 是唯一确定的，因此当 V > 已知时，我们可以计算出 
相应的标准测度（参阅习题 3). ► 

我们的下一个目标是证明，引理2描述了所有无穷可分特征函数的全体，为此 
我们必须首先解决本节开始时所述的收敛性问题.我们现在把它写成下面稍微更 
一般的形式 | 设 {M n } 是一列标准测度，并且 

MO = J : ^ 8 hlI M n { dx } + ib„C (2.16) 

其中6„是实数.我们要找使岭„ — 机其中也 是一个连续函数）的充要条件.注意 
(2.1) 或 (2.4) 所确定的函数知是 (2.16) 的一个特殊情形，其中 

Af n { di } = c „ i 2 F n { dx }. 


(2.17) 
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假设如 — 也且矽是连续的.于是 (2.13) 所定义的变换满足处—分★，即 

e^K(x)M n {dx} ^ V*(C), (2.18) 

其中是由 (2.15) 所定义的严格正的连续函数.左边是一个总质量为 

Atn= [ ^ K(x)M n {dx} (2.19) 

J—oo 

的有限测度的傅里叶变换.显然 Mn 4 ^(0). 容易看出， Mn -^0 蕴含对于所有的 
C , 功 ( C ) = 0,从而我们可以假定分~0) = / i >0. 于是由 

M*{dx} = -^-K{x)M n {6x} (2.20) 

所定义的测度是概率测度， (2.18) 说明它们的特征函数趋于连续函数 ^(0/ 
V *(0). 由此推出 

M* -* M*, ( 2 . 21 ) 

其中 A /* 是特征函数为 ^*«)/ V >*(0) 的概率测度.但是， V > n 可以写成如下形式： 

MO = ^n 仁 - K ~~-~-^ a ^-K-\x)M*{dx} + i6 n <. (2.22) 

被积函数是 a ： 的一个有界连续函数，从而 (2.21) 蕴含积分收敛.由此推出 — b , 
且我们的极限少具有形式 

V>(0 = M 广 -^- 7 ^- C 咖 3 ^ - 1 {x)M*{dx} + iK. (2.23) 

因为 M * 是一个概率测度，所以显然由 

M{dx} = fiK- 1 (x)M* {do:} (2.24) 

定义的测度 M 是标准的，并且 

机 0 = 广 ——-M{da;} + ibC- (2.25) 

这说明除了不相干的定中心项 iK 外，我们所有的极限都具有引理2所述的形式. 
正如已经所述的那样, (2.1) 所定义的函数 仏是 (2.16) 的一个特殊情形，从而我们 
解决了本节开始时所述的收敛性问题.我们把这个结果叙述为 
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定理 1 无穷可分特征*數类和形如#的函教类重合，其中矽是借助一个标准 
測度 M 和一个实数 & 由 (2.25) 确定的 • 

换句说，除了任意的中心常数外，在标准测度和无穷可分分布之间有一个一 
一对应 • 

在上节中我们强 调过： 条件 Mf — M * 和6„ -* 6是关系式办* — 必成立的必 
要条件.实际上我们也已证明了这些条件的充分性，因为 < 可以写成 (2.22) 的形 
式，因此也*显然趋于由 (2.23) 所确定的 极限. 于是我们得到了一个有用的极限定 
理，但是最好用标准测度 M „ 和 M 来表示条件咐 — M *. (2.22) 确定了 M „ 和 
M * 之间的 关系. 在任一有限区间上 K 是取0与 oo 以外的有界值，因此对于每个 
有限的/,关系式 M *{ I } M *{ J } 和 M „{/} M { I ] 是相互等价的.当 : c — oo 

H , K 的性质和 ar 2 的性质几乎相同，从而 M ^{® 7oo } ~ M +( x ), 其中 M 才 表示 
在标准测度的定义式 (2.10) 中出现的积分.于是正常收敛 Mf — M * 完全等价于 
条件： 对于 M 的所有连续区间， 

M „{/} -* M { I ), (2.26) 

且对于所有的连续点 x >0. 

M +( i ) -* M + (x), M~{x) -» M -( x ). (2.27) 

在形如 M n { dx } = c „ z 2 F „{ dx } (其中凡是概率分布）的标准测度的特殊情形下，这 
些关系式呈形式 

CnjT x 2 F n { di } -* M{I} (2.28) 

和 

Cn [ l - F n (*)] M + ( x ), CnF n (- x ) ^ (2.29) 

如果 J = D 是一个不包含原点的有限连续区间，那么 (2.28) 显然殖含 c „ F „{/} ^ 
M + ⑷- M +(6), 从而可以把 (2.29) 看作 (2.28) 向半无穷区间的 推广. 一个等价的 
条件是 | 没有质董流到无穷远处，这就是说，对于每个£>0,有相应的一个 T , 使 
得至少对于所有充分大的 n , 

Cn [ l - F„(t) + F „(- r )] < c . (2.30) 

在有条件 (2.28) 的情形下，条件 （2.29) 和 (2.30) 相互 等价. [注 意， (2.30) 的左边是 
t 的减函数 .] 标准测度 M „{ dx > = c n ® 2 F „{ dx } 的序列将如此经常地出现，以至于 
为了便于引用，最好引入一个方便的术语. 

定义 2 称标准測度列 { M n } 正常地收致于标准涮度 Af , 如果它们满足条件 （2.26) 
和 （2.27). 当且仅当在这种情形下，我们记 M n ^ M . 
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利用这个术语，我们可以把我们关于收敛 rt > n -* rl > 的结论重新叙述如下. 

定理2 设 M „ 是一个标准測度，么由 (2.16) 所碲定 . 办*超于一个连续函數也 
当且仅当存在一个标准測度 M , 使得 M „ -» M , t »„ — 6. 在这种情形下，少由 （2.25) 
给出. 

以后我们只把这个定理应用于特殊情形 

^(0 = ^(0-!-^], (2.31) 

其中是一个概率分布&的特征 函数. 于是我们的条件呈如下形式： 

CnPFddar } M { di }， Cn ( A » -b„) — b (2.32) 

其中我们再次令 

/3 n = y sinx - F n { di }. (2.33) 

由 17.1 节定理 1, 我们的条件不仅适用于 复合泊 松分布序列，而且还适用于形如 
的更一般的序列. 

关于其他标准表达 式的注测度 A / 不是文献中遇到的那种测度 . P . 列维在其开创性著作中 
利用了在嵌点外由 A { dx ) = x ^ Mldx } 定义的测度儿并且此测度是 nF „{ dx } 的极限•它 
在区间 \ x \> S >0 上是有限的.但是在原点附近是无界的.它不考虑 M 在原点上的原子 
(如果有的话).利用这个测度， (2.9) 里形式 

V «) = |< r 2 C a + i 6 C + Jim ^ ^ [ e l(x -1 -iCsin x ) A { dx }. (2.34) 

这是 P . L 4 vy 的最初的标准表达式（除了中心函数不同以外).它的主要缺点是，为了充分 
陈述测度 VI 的所要求的性质，需要费很多口舌. 

辛钦引入了由 if { d »> = (l + ^ J -' Afld *} 定义的有界测度.这个有界测度可以任意选 
择，辛钦的标准表达式为 

*( C ) = i «< + J ^°° [ e Kl - 1 - (2.35) 

最容易描述这个表达式，因为它避免了无界测度.这个优点被下述事实所抵消^测度 A •的 
人为性不必要地使许多论证更加复杂.稳定分布和 17.3 节例 （ f ) 说明了这种困难. 

特征函数的导数 

设 P 是一概率分布，其特征函数为#在 15.4 节中曾证明，如果 F 有限期望 h 那么 
V 具有导数 〆 ，并且 ‘ 其逆不真•沪的可微性与具有共同分布 F 的独立随机变量 



506 第 17 幸无穷可分分布 


序列 { X fc } 的大数定律有密切关系，因此许多人研究加在 F 上的、能保证 〆 存在的条件. 
皮特曼 （ E . J . G . Pitman ) 1956年根据济格蒙徳 （ A . Zygmund )(1947) 给出的部分答案解决 
了这个问题（济格蒙徳还对 W 附加了光滑度条件).由于直接解决这个问题要遇到非常大的 
困难，所以若知它的解答可作为上一定理的简单推论得到将是有趣的. 

定理3 下列3个条件是相互等价的. 

( i ) ^(0) = !/*• 

( ii ) 当 t —* oo 时， 

t[l- F(t) + F(-t) 卜0, J * xF{dx} - fi. (2.36) 

( Hi ) 平均值 （&+•■• + 依概率為于 p . 

证因为 ¥> 的实部是偶函数，所以导数 ^(0) -定是纯虚数.为了得到我们的极限定理与 
关系式 ^(0) = i M 之间的关系，最好把后者写成形式 

«[¥>(</*) - 1] — i〆，t — oo . (2.37) 

如果 t 取遍序列 { c „}, 那么上式成为 (2.31) 的一个特殊情形，其中= V »( C / cn ), 
F „(*) = F ( cnx ). 干是定理2断言，为使 (2.37) 成立，当且仅当 

tX i F{tAx} —*Q,t J 8 inxF { tdz } —► n. (2.38) 

( a ) 假设 (2.36) 成立，利用分部积分可得，对于任意的 a >0, 

t ^ x a F{tdx} F(tx) + F (- te )] da :. (2.39) 

当 t — oo 时被积函数趋于 0, 从而当 t -* 00 时积分趋于 0. 因为 | tsm */ t - i |< cx 2 , 所以 
由此容易推出 (2.38) 成立，这就得到了 (2.37). 反之， (2.38) 显然里含 （2.37). 因此，条件 
W 和⑻是等价的. 

( b ) 根据 17.1 节定理1我们有，为使 iP n ( C / n )- e 1(lC , 当且仅当 

咖 ( CA 0 -!]-*>/<■ (2.40) 

换句话说，为使大数定律成立，当且仅当 t 取遍正整数序列时， (2.37) 成立.因为特征函败 
的收敛在有限区间上自然是一致的，所以很明显 (2.40) 邃含 (2.37), 因此条件⑴和 （ iii ) 是 
等价的. 

也可以利用7_ 7 节定理1中的不同方法来证明 (2.36) 是大数定律 （ iii ) 的充要条件_ ► 
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17.3 例与特殊性质 

我们先列举一些特殊分布，然后转向矩的存在性和正性等性质.把它们作为例 
子编入，部分地是为了使说明清晰，部分地是为了强调各个项目之间是没有联系 
的. 本节的所有内容以后都用 不到. 进一步的例子可在习题6、习题7和习题19中 
找到. 

例 （ a ) 正态分布.如果 M 集中于原点上，并且对原点賦予质童 cr 2 , 那么 (2.25) 
导致利0 = -^ C 2 , 并且#是正态的，它的期望为0,方差为 o 2 . 

例 （ b ) 泊松分布.期望为 a 的标准泊松分布的特征函数为 w = #,其中 ■= 
a ( e *< - 1). 我们改变位置参数，以便得到集中在形如 -6 + n / i 的点上的一个分布. 
这就把指数变成 〆 C ) = a ( e i<fc - l )- i 6 C . 此式是 （2.25) 的一个特殊情形，其中 M 
集中于点上.因此，测度 M 集中于一点上这一性质是具有任意尺度参数的正态 
分布和泊松分布的特征.有限多个这样的分布的卷积对应于具有有限多个原子的标 
准测度.最一般的测度 M 可以作为这样的测度序列的极限而获得，因此所有无穷 
可分分布是有限多个正态分布和泊松分布的卷积的极限. 

例 （ c ) 随机化了的随机 游动. 在 2.7 节 (7.7) 中我们曾遇到过一族对》*=0,±1， ±2,.. 
賦予概率 _ 

知 ⑴=把 Je ^ I ^ y / pqt ) (3.1) 

的算术分布 • 此处参数 P , g , t 是正的， p + <7 = 1, 是 2.7 节 （7.1) 中定义的贝塞尔 
函数 .{ a r } 满足査普曼-科尔奥戈罗夫方程这一亊实表明它是无穷可 分的. 它的特 
征函数 u = e ^ 很容易算出，因为它与施勒米希展开式 2.7 节 (7.8) 的不同之处只是 
变量代换 ti = 结果 

0(0 = -t + t ( pe if + ge -iC ) (3.2) 

表明， {^( t )} 是两个期望为舛和矽的独立泊松变量之差的分布.标准测度集中于 
点±1上. 

例 （ d ) r 分布.密度为 


9 t(x) = e -x * t-1 /r(t), * > 0 

的分布的特征函数为 MO = (1- iC )-*, 此函数显然是无穷可分的.为了把它写成 
标准型，应注意 ^ 

( lni / t (0)’ = it(l - iC )- 1 = it j: e ^^ dx . 


(3.3) 
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利用积分可得 


lni / t ( C ) = 


(3-4) 


因此，标准测度 M 由密度 txe~ x (x > 0) 确定. 此处不需要定中心项，因为没有它 
积分也收敛. 

例 （ e ) 双曲余弦 密度. 我们在 15.2 节已看到，密度 f ( x ) = 1/ jicoehx 的特征函数为 
w ( C ) = l / co 6 h (« C /2). 为了证明它是无穷可分的，我们注意到 （ lnw )" = ~( ie /4) w 2 . 
w 2 是在 2.9 节习题6中算出的密度 / 2 * 的特征函数.于是 


d a 

dc 5 


lnu>(0 = 




(3-5) 


因为 （ lnw )' 在原点处等于 0, 所以我们得到 

^^(0 = #。-匕二 :沙 . (36) 


因此，标准测度有密度: c /( e *- e -*). 由对称性，项 iC = r 的贡献等于0;因为没有它 
积分也收敛，所以可以从分子中把这一项去掉 • 

例 （ f ) P . 列维的 例子. 函数 


V>(0 = 2 2- fc [cos2 fc C-l] (3.7) 

具有 (2.9) 的形式，其中 A / 是对称的，并对于点 ±2* 賦予质 M 2 fc (fc = 0,± l ,±2,.-.). 
(这个级数收敛，因为当 A : — - oo 时1 - cos 2 - fc C ~ 2 2 *-^. ) 特征函数 u ; = #具 
有如下奇特的 性质： w 2 ( C ) = w (20, 从而 cj 2 "(0 = w (2* C ) .由（在 6.1 节中引进的 
意义上的）稳定性，对于所有的我们应有 = 但是这个要求只有当 

n = 2,4,8…时才被满足.利用 17.9 节的术语，这个 o ; 属于它自己的部分吸引域， 
但是它没有吸引域 .( 见习題 10.) 

例 （ g ) 单側穗定密度.我们来计算与满足 

M{0^} = Cx 3 -。， 0 < a < 2, C>0 (3.8) 

的集中在 D 755 上的标准测度相对应的特征函数.本例很重要，因为我们可由它推 
导稳定特征函数的一般形式. 

⑴如果0 < a < 1,那么我们考虑特征函数= e *% 其中 
r °° e i <* _ 1 

MO = C(2-a) J o (3.9) 
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此式与标准型 (2.9) 的不同之处在于省略了定中心项，此项可省去，因为没有它积 
分也收敛.为了计算这个积分，我们假设 C > 0,并把它看作是 


idx = -(A - iC ) / e -^-^^ x -^ da : 


=-一 r(l - a )( A - iC )°. 


(3.10) 


当 A 0+ 时的极限（关于 r 密度的特征函数见 15.2 节).现在 


( A - iC) a = ( A 2 + C 2 ) Q /2 e Wa , 

其中 0 是 入 - iC 的辐角，即 taxi 0 = - C / X . 显然，当 A — 0 +时， 0 - Ji / 2 , 从而 
( A - iC ) a ^ ^ e -^ 2 . 我们把最后这个结果写成形式 

MC ) = C - c -' C >0. (3.11) 

对于 C > 0,詬 ( C ) 是 M -0 的共扼. 

( ii ) 当1 < a < 2时，我们令 

MO = cj " 6，<I 二; ~ 1 Cl dx . (3.12) 

此式与标准型 (2.9) 的不同之处在于这里把中心定在期望为 0. 通过分部积分可化 
简分母中的指数,并能够使我们利用上述结果.通常的计算表明，仍由 （3.11) 给 
出. （实部仍是负的，因为现在 cosna /2 < 0.) 

( iii ) 当 a = 1时，我们利用标准形式 

祕)=以 、办-孕 (3.13) 

从 15.2 节中我们知道 (1- co 6 i )/( jcc 2 ) 是一个概率密度，从而呶 ( C ) 的实部等于 
-|« C . 关于虚部我们得到 

r =；» [f - c f . <3,4, 

当 C > 0时代换 Cc = I /把第1个积分化成第2个积分的形式，整个式子化为 

字心穿，-⑽,（叫 

于是最后有 

咖 (C) = C(-|jcC-iClnC)，C>0. (3.16) 
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当然， tM - C ) 是咖 ( C ) 的共辑. 

当 a 会1时特征函数 w = e — 具有如下 性质： w n ( C ) = 这就是说，按 

照 6.1 节的定义， w 是严格稳 定的： 特征函数为 w 的独立变量 X u …， X n 之和与 
有相同的分布.当 a = 1时我们有 ^( O ^ wCnOe - JC "", 从而这个和的分 
布与 nV - X , 的分布的不同之处仅在于它的中心常数.因此，咖是广义穗定的. 

味于稳定分布的各种各样的性质和例子，见 6.1 节〜 6.2 节.其他的性质将在 
17.5 节中导出.在 17.4 节中我们将看到，当 a < 1时分布集中于正半轴上.这对 
a > l 是不正确的 .] 

例 （ h ) —般的稳定分布.对于上例的每个 tA a , 有一个类似的特征函数与之对应， 
它是由具有相同密度的标准测度导出的，但它集中于负半轴上.为得到这些特征函 
数，只要把我们的公式中的 i 变成- i 就行了.如果取两个极端情形的线性组合，即 
利用这样一个标准测度 M , 使得对 x >0, 

M { iTx } = Cpx 2 ~ a , M {=^} = Cqv 1 - 0 , (3.17) 

那么我们可以推导更一般的稳定特征 函数. 此处 p >0， g >0 ,p + 9 = l . 由此显然 
可见，相应的特征函数 w = e * 当 0< a < l 或 l < a <2 时由 

m = [ co8 ^± i ( p - 9 ) 8in ^] (3.18) 

确定，当 a = l 时由 

VKC) = -|CI. C gn ± i(p - g) log |Cij (3.19) 

确定. 此处当 C > 0 时用上面的符号，当 C < 0时用下面的 符号. 注意，对 a = 2我 
们得到 V <( C ) = ~\(p + qK a , 即正态 分布. 它对应于集中在原点上的测度 M . 

在 17.5 节中将指出（忽略任意的中心常数)，这些公式给出了最一般的穗定特 
征 A 数.特别，任何对称的稳定分布都具有形式的特征函数，其中 <!>().► 

17.4 特殊性质 

在本节中 a ; = e v > 表示一个无穷可分特征函数， 其中於 是以标准型 

m = j : — + iK (4.1) 

给出的，这里 M 是一个标准测度， b 是一个实常数.由标准测度的定义，积分 

M + (i) = p y- 2 M{dy} (4.2) 
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对所有的 x > Q 都收敛，类似的陈述对 i <0 也成立 • 

具有特征函数 w 的概率分布将以1/表示. 

( a ) 矩的存在性 .在 15.4 节中曾证明， 1/ 的二阶矩是有限的，当且仅当 o ; 是二 
次可微的，即当且仅当^存在.同样的论证可以证明，为使情况是这样的，当且仅 
当测度 M 是有限的.换句话说， C / 的二 阶矩存在的充要条件是測度 M 是有限的. 

利用类似的推理（见 15.9 节的习题 15) 可以证明，更一 般地， 对任 一整数 fc > 
1, y 的 2 fc 阶矩存在的充要条件是 M 有 2 fc - 2阶矩. 

( b ) 分解.每个把 M 表示为两个测度之和的表达式 M = Mi + M 2 都以一个明 
显的方式，导出一个把^分解成两个无穷可分特征函数的因子分解 w = eh e h . 如 
果 Af 集中予一点上，那么和 W 2 也都集中于一点上.换句话说，如果 w 是正 
态特征函数或泊松特征函数，*那么这两个因子和 eh 也都是正态特征函数或 
泊松特征函数_但是任一其他的无穷可分的 w 可以分解成两个本质上不同的分 M . 
特别地，任一非正态稳定特征函数可以分解成非稳定无穷可分特征函数. 

一个特别有用的分解式 w = 可以通过把 M 表示为两个分别集中于区间 

M 和 ㈣ 上的测度之和而得到.对于后者我们利用由 N { dx } = ®- 2 M { dx } 
定义的测度 W 表示 M . 于是我们记 

^(O = MQ + MO + '0 C , (4.3) 

其中 . 

^ i (0 = elCX ~ y KX M { dx }, (4.4) 

MO = / ( e 1Cx - l ) N { dx ], (4.5) 

差 b - j 3 说明 (4.4) 和 (4.5) 中被改变的中心项. 

注意， e % 是这样一个概率分布 F 产生的复合泊松分布的特征函数，这个分布 
F 满足 F { dx } = dV { di }, 或者 

1 — ^( i ) = cM + ( x),x > 0. (4.6) 

函数是无穷次可 微的. 于是我们看到，每个无穷可分分布 I ；是一个具有所有各 
阶矩的分布与一个复合泊松分布 l/ a 的卷积， 这个队 是由一个具有与 M + 和 
M - 成比例的尾部的概率分布 P 产 生的. 由此特别推出，为使 U 具有 A 阶矩，当 
且仅当 F 的 fc 阶矩存在. 

①槿据 15.8 节的定理1,正态特征函数不能分解为非正态特征 a 数.对泊松分布也有类似的结论（莱 
科■夫 ( Raikov ) 定 理). 
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( c ) 正变量. 我们来证明， f ； 集中于 0^5 上，当且仅当® 

r °° e ' C * — 1 

V >(0 = J o -^― P { dx } + i 6 C , (4.7) 

其中 6>0. P 是这样一个測度，使得 （1 + *)- 1 关于 P 是可积的. [利用 （4.1) 原来 
的记号，我们有 P { dx } = x ~ l M { dx }.] 

假设 t / 集中于 (0, oo ) ±,并考虑 （4.3) 〜 （4.5) 所述的 分解. 原点是复合泊松 
分布的的 增点. 分布 ％ 的期望为0,因而它有一个增点 S < 0. 由此推出 S + /3 是 
U 的一个增点，从而 办 > 0. 同样的论证表明不可能有正态分量，因此当 — 0 
时， £ A 的贡献一定趋于 0. 最后，如果 t 是产生£7 2 的概率分布 F 的一个增点，那 
么 nt 是 f / 2 本身的一个增点.由此推出 F 集中于正半轴上，从而 AT 集中于正半轴 
上，因此 （4.5) 中的积分的积分域实际上是 x > V . 被积函数在原点上等于0,从而 
在取极限 — 0时，测度 iV 不一定 有界. 但是，对于 x > r ), 我们可以把测度 AT 换 
成 P { dx ] = : 1 ^{此}(此式和 x ~ l M {6 x ) 相 同). 新的被积函数 （ e 办 - l ) x -> 的值是 
0以外的有界值，从而 P 对原点的邻域也一定賦予有 限值. 这样我们就得到了表达 
式 (4.7). 

反之，如果於是由 （4.7) 确定的，那么我们的论证说明，#是集中于上的 
复合泊松分布的特征函数列的极限.因此，对于极限分布[/也有同样的结论成立. 

( d ) 漸近性质. 关于矩的存在性的结果似乎表明，分布函数当 a : — ±oo 时 
的渐近性质只依赖于标准分布 M 在 ± oo 附近的性质，或者同样地，只依赖于函数 
M + 和 M - 的渐近 性质. 我们不打算在尽可能一般的情况下证明这个推测，而只考 
虑一个典型情况 | 

倣设 M + 在 oo 点处是正則变化的，即 

M + ( x ) = x ~ c L ( x ), (4.8) 

其中>0，£是缓慢变化的.那么 

1 — t /( x ) ~ M + ( x ), x -* oo . (4.9) 

证设 S 尹一 t 以 U 为分布函数的随机 变董. 把标准测度 M 看作是三个集中于 
区间 - oo ,- l 上的测度之和从 +. M2 + M3 . 正如 （ b ) 中所证明的那样， 
这导出一个把 S 作为三个独立随机变董之和的表达式 S = X i + X 2 + X s + p ： Xr 
服从复合泊松分布此分布是由集中于 T ^ S 上的概率分布 F 产生并由 （4.6) 确 

①这个结果由 P . 列维给出，它也是 13.7 节 (7.2) 拉普拉斯变换形式的直接推论.有《的是，不用撅 
率论证 • 这个断言的形式上的驗证很麻规（见 G . Baxter and J . M . Shapino , Sankbya , vol .22). 
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定的； 相应于 X 2 的标准测度集中于 -1,1 上； 最后 X 3 的定义方法与的相同， 
所不同的只是这里 -00,-1 起1,00的作用.不难证明， 

P{Xl > x} 〜 M + (x), X —K30. (4.10) 

(见 8.9 节的定理 2). 因此，为了证明断言 (4.9), 只需证明 

P{5 > ®} ~ P{Jfi > x}, x oo (4.11) 

就 够了. 在这种情形下，中心常数不起作用，我们可以假设 ,3 = 0. 于是对于每个 

e > 0, 

P{S >x}^ P{Xi >(1 + e)*}- P{X 2 + X 3 > -ex}. (4.12) 

另一方面，因为 X 3 <0, 所以 

P{5 >®} ^ P{A! > (1 - £)*} + P{X 2 > ex}. (4.13) 


当 x — oo 时， (4.12) 中最后一个概率趋于 1, 而 (4.13) 中最后一个概率比任何次幂 
aT a 减少的速度都快，因为义 2 具有所有各 阶矩. 因此 （4.12) 和 (4.13) 蘊含 (4.11) 
的正确性. 

(e) 从 属性. 如果# 是无穷可分的，那么对于每个 s > 0,e^ 也是无穷可分的. 
通过把参数*随 机化，我们得到一个下列形式的新的特征 函数： 

< p (0 = (4.14) 

其中 G 是集中丁 -0,00 上的任意一个概率分布.特征函数不一定是无穷可分的，但 
是容易验证，如果 G = GykG 2 是两个概率分布的卷积，那么（以明显的记号）有 
f = < Pi -< P 2. 由此推出，如果 G 是无穷可分的，那么 （4.14) 确定一个无穷可分特征 
* 数. 

这个结果有简单的概率解释.设 {X(«)} 表示一个独立 增童过 程的变董， X ( t ) 
的特征函数为 e w. 如果 r 是一个分布为 G 的正变童，那么 p 可以看作是复合随 
机变 i X ( T ) 的特征 函数. 假设 G 是特征函数为的无穷可分分布.我们可以考 
察另外一个独立增量过程 {T(«)}, 使得 T(t) 的特征函数为 e' 对于每个 t > 0,我 
们得到一个新变董 X ( T ( t )), 这些变筐也是一个独立增董过程的变童 .® 于是 T ( t ) 
可作为操作时间.利用 10.7 节的术语，新过程 {A：(；T(t))} 是通过 从属性 得到的，栺 
导过程为 {r(t)}. 于是我们得到了从厲过程恒导致无穷可分分布这个事实的一个纯 
分析 证明. _ 

①如果 G 的拉普拉斯变换为 e -^), 那么 T ( t ) 对应于拉普拉斯变換容 易齄证 X ( T ( t )) 
的特征函数为 
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17.5 稳定分布及其吸引域 

设 { X n } 是具有共同分布 F 的相互独立随机变量序列，令= & +…+ X „. 
设 f / 是一个不集中于一点上的 分布. 按照 6.1 节中引进的术语，当且仅当存在常数 
a „ > 0和使得 a - x 5„- n 6„ 趋于 U 时，我们称 F 属于 I ；的吸引域.排除集中 
于一点上的极限分布，是为了排除如下不足道的 情况： — 6而如如此迅速地增 
加，以致于 a ->5„ 依概率收敛于 0. 

我们想用分布 F 和1/的特征函数#和 w 来重新叙述吸引域的定义.按照 15.1 
节的引理4,为使分布 t / 集中于一点上，当且仅当对于所有的 c , MC)l = i - 因此， 
为使 W 属于特征函数 w 的吸引域，只需 | w | 不恒等于1,并且存在常数> 0和 
b n , 使得 

(5.1) 

在 6.1 节中曾证明，极限 w —定是稳定的，但是我们现在再把整个理论看成 
17.2 节基本极限定理的简单推论来讨论.为了与那里的记号保持一致，我们令 

< Pn (0 = ¥»( C / an ) e _i6 " c , F „( x ) = F ( a n (x + b n )). (5.2) 

根据 17.1 节的定理 1, 为使关系式 （5.1) 成立，关且仅当对于所有的 C , 

nK(0 -1]-* 妒 (0 ， (5.3) 

其中 w = #. 

首先考虑 F 为对称分布的这一特殊 情形. 此时<>„ = 0. 我们从 17.2 节定理1 
知道， （5.3) 菹含，存在这样的标准测度 M , 使得 nx 2 F „{ da :} - M { dx }. 为了表示 
这个结论,我们引入截尾矩函数 


/*(*) = J y 2 F{^y), $ > o. 

(5-4) 

于是在所有的连续点上， 


■^ H ( a n x ) -» M {- x , x) t 

(5.5) 

且 


n[l - F(o,»®)] M + { x ), 

(5.6) 

其中 oc 


M + ( x ) = j y ~ 2 M { dy }. 

(5.7) 
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• 关系式 ^( C / a „) — 1蕴含 o „ — 00 ,因此 5„/ a „ 和 S n / a n+1 有相同的极限分 

布 U _ 由此推出比 a „ +1 / a „ 趋于1，从而 8.8 节的引理3可应用于 (5.5). 我们得 
，到， M 是 正则变化的， 且标准测度 Af 具有形式 

M {- x , x } = cx 2 ~ a , i > 0, (5.8) 

其中 a < 2 . (为了与 P . 列维所引入的用法一致，用2 - a 表示指数. ） 如果 a = 2, 
那么测度 M 集中于原 点上. (5.7) 中的积分的收敛性要求 a > 0;对于0 < a < 2, 
我们求得 _ 

M + ( x ) = C 一 2 ^ a g ~ Q , * > 0. (5.9) 

类似的论证也适用于非对称分布但是代替 (5.6), 我们得到如下不太吸引 
i 人的关 系式： 

n[l - FM* + &*»))] —M + ⑻， 

nF ( on(-x + b „)) (5.10) 

I 类似的修改适用于 (5.5). 然而，^„(0 -* 1和 a „ — oo 这个事实蘊含6„ — 0,因此 
i (5.10) 实际上完全等价于 (5.6) 和关于左尾部的类似关系式. 

于是我们看到，当 F 厲于一个吸引域时 (5.6) 成立.由 8.8 节的引理3看来， 
这就是说，或者 M + 恒等于0,或者尾部1 - F 正則变化 ，且 M +( x ) = Ax ~ a . 于是 
'(5-7) 说明，测度 M 在正半轴上有密度 Aax 1 - 0 . 同样的论证适用于左尾部以及尾 
部之和，因此指数 a —定为两个尾部所共有. 

如果2个尾部都恒等 f 0,那么 M 集中于原 点上. 在所有其他的情形下, M 不 
可能在原点上有原子.因为对应于对称化了的分布的标准测度 <> M 是 M 与它 
' 关于原点的镜像的和，我们已看到， Q M 或者没有原子，或者集中于原点上.因此， 
当 a < 2时，标准测度 M 被它在两个半轴上的密度唯一确定，这些密度与 I *! 1 - 0 
： 成 比例. 因此，对干包含原点的区间我们有 

M {- y , x } = C ( qy 3 ~ a + px 2 ~ a ), (5.11) 

其中0 < a < 2 ，C > 0 ,p + 9 = 1.对于 a = 2,此测度集中于原点上.根据(5.7)，这 
等价于 _ 

M + ( x ) = Cp ^^ x ~ a , 

M ~(- x ) = Cq ^- x ~ a . (5.12) 

相应于这些测度的特征函数由 （3.18) 和 (3.19) 给出.它们表明，在 f ； 2 ★与 
不同之处仅在于位置参数的意义上我们的测度是稳定的.这就是说，每个稳定分布 
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属 于它自 己的吸引域，因此，我们解决了求所有具有吸弓I域的分布的问题.我们把 
这个结果写成 

定理1 一个分布具有吸引域，当且仅当它是穗 定的. 

⑴ 稔定分布类与具有由 (5.11) 给出的标准測度的无穷可分分布类重合 • 

(U) 相应的特征函數呈 w ( C ) = e*(0+»C 的形式,其中垆由 （ 3.18) 〜 (3.19) 确 
定，0 < a < 2. 

( iu ) 当 a : -» oo 时，相应分布 y 的見部满足 

x a [l-U(x)]^Cp^-, 

a 

x a U(-x) — (5.13) 


如果我们注意到 U 属于其自身的吸引域，正规化常数为 a n = n 1 /°, 那么 （ iii ) 
是 （5.6) 的直接 推论. [换句话说， （5.13) 是 17.4 节⑷ 中所得的结果的一个特殊情 
形 •] 

应注意，除中心常数外，本定理中的3个断言每一个都唯一地确定了 （/. 

在回过头来研究使分布 F 厲于一个稳定分布的吸引域的条件之前，我们回忆 
一下一个关于正则变化的基本结果.按照 8.8 节中的定义，函数 L 在无穷远处是缓 
慢变化的，如果对于毎个固定的 x >0, 


在这种情形下，我们对于任意的5 > 0和充分大的 a ; 有 


x~ 6 < L{x) < x s . 


(5.15) 


函数 M 是正则变化的，如果它具有= x » L ( x ) 的形式.我们特别地考虑 (5.4) 
所确定的截尾矩函数 M •把&9节的定理 2( 在其中令 C = 2,17 = 0) 应用于@上 
\ 由 F ( x )~ F (- x ) 定义的分布函数，我们就得到下列重要 结果： 

如果 /i 是正則变化的，且指數为 2-a( 其中 0<a<2), 那么 

^[l-F{x) + F(-x)]^2-a ( 5 . 16 ) 

"(i) a 

反之，如果 (5.16) 对 a < 2 成立，那么/!与足部之和 


l-F(x) + F(-i) 


都是正則变化的，且指數分别为 2 - a 和一 a . 如果 (5.16) 对 a = 2 成立，那么卩 
是缓慢变化的. 
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在推导 (5.8) 时我们看到，一^对称的 F 属于一个吸引域的必要条件是截尾矩 
函数 M 为正则变化的： 

n ( x ) ~ i 2- a i ( x ), x —* oo , (5.17) 

其中 L 是缓慢变化的.我们现在将看到这对非称分布也是正确的.当 a = 2时，这 
个条件也是充分的，但是当«<2时标准测度 (5.11) 賦予正负半轴的质量之比为 
p ： q , 可以证明 F 的两个尾部一定有同样的比值. 

我们现在能够证明基本的 

定理2 ( a ) 一个分布 F 属于某一吸引城的必要条件是截尾矩禹数卩为正則变化 

的，且具有指数2 - a (0 < a < 2). 1也就是说， (5.17) 成立 • j 

(1))如果《 = 2,且 F 不集中于一点上，那么这个条件也是充分的 • 

( c ) 如果 (5.17) 对于0<£*<2成立，那么 F 属于某_吸引城，当且仅当两个 
尾部是这样被平衡的，以至于当3： — 00 时， 

l ~ F { x ) F (- x ) 

1 - F ( x ) + F {- x ) P, 1 - F { x ) + F (- i ) q ' ( 518 ) 

注意，关于尸的中心常数我们并没有作什么假设.因此，定理癟含 （5.17) 或者 
对任意的中心常数都成立，或者对所有的中心常数都不 成立. 除了当 P 集中于一 
点 f 时， (5.17) 的左边对于中心常数 f 恒等于0,对于所有其他的中心常数是正则 
变化的以外，上述结论的正确性容易验证. 

之所以这样叙述这个定理，是为了包含向正态分布收敛.当 a < 2时，似乎用 
F 的尾部之和比用 oo 表示主要条件更为自然.下列两个系以等价的形式重新叙述 
本定理. 

系1 一个不集中于一点上的分布尸属于正态分布的吸引城，当且仅当 / i 是缓谩 
变化的. 

为使情况是这样的，当且仅当 （5.16) 对 c » = 2成立 • 

不用说，当 F 有有限方差时， / i 是缓慢变化的. 

系2 —个分布 F 属于一个指數为 a <2 的穗定分布的吸？ | 域，当且仅当它的足 

部满足平衡条件 (5.18) ,且尾部之和是以指数 a 正則变化的 • 

后一条件完全等价于 (5.16). 

证 （ a ) 必 要性. 假设极限分布 [/ 的标准测度由 (5.11) 给出.在推导这个关系式的 
过程中我们看出，属于 I ；的吸引域的分布满足 (5.6) 和关于左尾部的类似公式，从 
而 . 

n[l - + F (- o „ x )] - M + ( a :) + (5.19) 

首先假设 a <2,因此右边不恒等于0._正如已经所述的那样，此时 8.8 节的引 
理3保证尾部之和1 一 F ( x ) + F (- x ) 是以指数-《正则变化的.但是，此时 (5.16) 
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成立，从而/ X 是以指数2 - a 正则变化的.于是平衡条件 （5.18) 是 (5.6) 的直接推 
论. 

还剩下 a = 2 的情形.此时 (5.19) 的左边趋于零，于是对于某个 k ^ n ,\ X k \> 
a n 的概率趋于 0. 因此，为使 S n / On 不依概率趋于0,必要条件是 XfcK 1 的截尾二 
阶矩的和是0以外的有界值.但是 


M(°n) 

l-FM + Fi-On) 


- > oo , 


(5.20) 


从而 (5.16) 对 a = 2成立.这瑄含 m 是缓慢变化的，因此我们的条件是必要的. 

( b ) 充分性.我们不但要证明我们的条件是充分的，而且还要确定保证向一给 
定稳定分布收敛的正规化常数和6„.这将在定理3中进行. 

定理3的叙述要用到下列 亊实： 在满足> 1的任一吸引域内的分布的期望 
存在.在证明中，我们将需要关于截尾一阶矩的另外的知识.在更一般的背贵下阐 
述这些结果是很自然的，虽然我们只需要 0=1 的特殊情形. 

引理一个属于栉數为 a 的吸引域的分布 F 的所有 0< a 阶绝对矩 m / j 都存在. 
如果 a <2,那么所有 0> a 阶矩都不存在. 

更确切地说，如果 0< a , 那么当£ oo 时 

杯 卜 ㈢ ， 

而对于 a <2 h P > a , 

[\ x \ 0 F { dx ] - _ F ⑴ + F (- t )]. 

J\x\<t P~Ot 


(5.21) 

(5-22) 


(注意，在每种情形下，积分都是一个指数为 /3- a 的正则变化函数 .） 

证关系式 （5.21) 和 (5.22) 表示一般形式 (5.15), 并且是 8.9 节屮定理2应用于 
0^5上由 F ( x ) + F {- x ) 所确定的分布所得到的直接推论.对于 (5.21), 4- C = 
2 ,ri = 0 ,rj = O . ► 

在定理2的证明中组含正规化常数 On —定满足条件 



(5.23) 


如果 M 是正则变化的[满足 (5.17)], 那么这样的 a „ 就存在，我们可以把 o „ 定义为 
使 nx ~^( x ) < C 的所有 a : 的下界.于是由正则变化性，我们对于 z > 0有 


n/i(OnX) 


-»Car 2 -**. 


(5.24) 
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这就是说，测度 nx 2 F { a n dx } 賦予任一对称区间的质董趋于•由 
(5.16) 看来，关系式 (5.24) 自然保证关于 F 的尾部之和的类似关系式 (5.19) 成立. 
当 a = 2时，右边恒等于0;当 a < 2时，平衡条件 (5.18) 保证各个尾部也满足所 
霈要的条件： _ 

n[l - F ( o „ x )] ^ Cp ^- x ~ a , 

nF (— a „ x ) — » Cq ^-~- x ~ a , (5.25) 

因为右边是与 M +(; r ) 和 M -( x ) 相等的. [顺 便提一下，当 a < 2时，关系式 (5.25) 
又蕴含 (5.24).] 

于是我们证明了测度 nx ^ Flandx ] 正常地趋于标准测度 M . 按照 17.2 节定理 
2,这蕴含 

:)二 ，-口 — 举 } . (5.26) 

由此现在容易导出 

定理 3 设 1/ 是一个穗定分布，当 a / 1 时，它由 特征* 敷 (3.18) 确定（包括中心 
常数)，当 a = 1 它由特征*數 (3.19) 确定（包括中心常数) • 

设分布 F 渴足定理 2 的条件，又设 { a „} 满足 (5.23). 

( i ) 如果 0 < a < 1, 那么 y > n ( C / on ) -♦ w ( C ) = • 

( Si ) 如果 1 < a <2, 那么上述结论同样成立，只要将 F 的中心定在期 2 为 0. 
( iii ) 如果 a = 1,那么 

( ¥ »( C / a n ) e - ifc "<)" - w ( C ) = e *«>, (5.27) 

其中 

r +°° x 

b n = I sin — F { d *}. (5.28) 

J—oo 

因此，我们有一个令人满意的结果：当£« < 1时不需要定中心手续，而对于 
«>1,只要把中心定在期望为0即可. 

证设 a < 1. (3.18) 中定义 V >(0 的积分与 (5.26) 的右边不同之处在于项 iCsin * 
消失了.我们证明这些项在 (5.26) 中也可以省去，因此 

/ +°° e *^ 1 — 1 „ r +ao e iC * _ 1 

―- nx 2 F { a „ da :} -♦ J — ^ - M { dx ). (5.29) 
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在原点的一个邻域之外被积函数是连续的，因为 ^ Fjondx } ^ M { dx }, 所以如 
果把区间 H J 从积分域中去掉，那么关系式 (5.29) 成立.因此只要证明， 当占充 
分小时 ， M < <5对左边积分的贡献可以任意小就行了.现在这个贡献由 




| x | F { a „ di } = 




(5.30) 


所控制，具有/3 = 1的 (5.22) 表明右边 

^ (2 - a/{l - a )) CS 1 - 0 , 


此式随 <5趋于0而趋于 0. 

因此， (5.29) 成立.它可以改写成 nMC / an ) - 1] - V -( C ) 的形式.根据 17.1 节 
定理1,此式等价于断言 

^"(C/an) -* InV'(C)- 

⑼设 a > 1. ( i ) 中所用的论证可以照搬过来，所不同的是 (5.26) 修改了的形 
式现在呈形式 

J : ^ Z ^ J ^ F{andx} 一 仁 x M { dx }. (5.31) 

为了证明它是正确的，我们必须证明，当 t 充分大时， w > t 对左边积分的贡献可 
以任意小.这可由 (5.21) 直接推出. 

( iii ) 设 a = 1. (5.26) 无需改变,但是为了证明这个关系式等价于断言 (5.27), 
必须证明对于固定的 （， 

¥ » n ( C / a n )~ e ^ < c / °" ，_1 l , (5.32) 

或者等价地说， 

n | v ( C / an ) - 1| 2 ^ 0. (5.33) 

对于 p < l , F 的绝对矩 W 是有 限的. 我们由显然的不等式 - 1| < 2|妒推 
出 |¥>«/ a n )- l |<2 m /3 | C |^, 从而 (5.33) 的左边是0(恥；：站).但是，定义关系式 
(5.23) 表明，对于毎个 e > 0, n = 0( a » + e ), 所以 (5.33) 成立. ► 

结束语不应该把正态分布的吸引域和 B . V . 格涅坚科引入的一个指败为 P 的稳定分布 
U 的正态吸引域混淆.称一^分布 F 厲于这个范围，如果它以正规化常数 a „ = n 1 ^ 屑于 
U 的吸引域.确定这个吸弓 I 域的界限原先是一个很难的问埋，但是在目前的情况下，其解 
答由加在正规化常数上的条件 (5.23) 给出.为使分布 F 厲于 I ；的“正态"吸引域，当且仅 
当 ® — oo 时， x a [ l - F ( x )] ^ Cp , x a F (- x ) -* C 9 . jftAh C > 0是常数.（顺便提一下，利 
用这个术语，正态分布有一个非正态吸引域 .） 
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* 17 . 6 稳定密度 

以闭合形式表示稳定密度似乎是不可能的，但是费勒 (1952) 和贝格斯特罗姆 
( H . Bergstr 6 in )(1953) 独立地给出了它的级数展开式.它们蕴含后来用更复杂的方 
法得到的结果，它们提供了傅里叶反演公式的应用的很好的例子(虽然利用了复积 
分).我们不考虑指数 a = 1的情形. 

对于 C >0 我们可以把稳定特征函数写成的形式，其中 a 是一个复常 
数_它的绝对值只影响到尺度参数，因此我们可以设 a 的模为1并记 a = 其 
中^是一个实数.于是我们令 


^(C) = -Kl a -e ±iw / 3 1 


( 6 . 1 ) 


其中当 < > 0时取上面的符号，当 C < 0时取下面的符号.[见标准型 (3.18)] 实部与 
虚部之比服从 （3.18) 中显然的不等式；利用现在的记号，•是穗定的，当且仅当 


H < { 


如果0< 
如果1< 


(6-2) 


因为#是绝对可积的，所以相应的分布有密度.我们将用 p(x;a,u) 表示它，并着 
手用 15.3 节 (3.5) 傅里叶反演公式来计算它.由于巳经知道 p 是实的， 训 - C ) 是 
VKC ) 的共轭函数，我们得到 

p(x;a,v) = n _1 Re J (6.3) 

只要对 a ： >0 计算这个函数就行了，因为 

p(-x-,a,u) = p(x;a, -v). (6.4) 

⑷ a < 1的 情形. 把被积函数看作是复变董 （ 的函数.当 a : > 0, lm < — -00 时， 
被积函数由于指数中线性项占优势而趋于 0. 这样我们能够把积分路线移到负半虚 
轴，这相当于利用代换 C = 和像所有系数都是实数那样进行.新的被积 

函数呈 e -*-^ 的 形式. 利用 e - rt ° 的指数展开式和我们所热悉的 r 积分可以推出 

p(-i;a,i/) = r (l + ” • (~ a：-a e x P - a )])*. (6-5) 


* 本节讨论一个特殊的 MW , 初读时可以略去. 



522 第 17 章无穷可分分布 


(b) 1 < a < 2的情形.利用形式代换 

C = t a ~ l exp (- 去 i3«V a ) 

的合理性可以像在 a < 1的情形那样说明，新的被积函数呈的形 
式.把 e-^ -1 展成指数级数，我们得到 

K-W) = ^exp(-0 gr((n+l)/a) (_一 ( 6 . 6 ) 

把求和指标 n 变为 fc - 1并利用熟知的递推公式 r(s + 1) = 8 T(a ), 我们可得 

p (- x > q >^= ■ (- xexp a )]) fc • ( 6 . 7 ) 

因此，我们证明了 
引理 1 对于 a:>0 和 0<a<l ， 

p(x;a,v) = ± ^ r( * - ^ ! + X) - (-x~ a ) k sin y (i/ - a). (6.8) 

对于 a:>0 和 l<a<2, 

p(z ; a ， v )= 忐会 t * /a) ' Bin 砮…一 a ). (6-9) 

当 a: < 0 时，它们的值由 (6.4) 给出 . 

注意 ， （6.8) 给出了 x-*oo 时的渐近 估计. 这些公式的一个奇特的副产品如下， 
引理 2 如果 ^ < a < l,i > 0 ,那么 

^iTP ( 去 ;|， *") = P(*; a ， 〆 )， (6-10) 

其中 i/* = a{v + 1)-1. 

利用简单的验算可以证明〆落在 （6.2) 所述的范围内，恒等式 (6.10) 是佐洛 
塔廖夫 （V. M. Zolotarev) 用复杂的证明首次得到的. 

17.7 三角形阵列 

三角形阵列的概念在 6.3 节中是这样给出的•对于每个有有限多个，比如 
说 r„ 个分布为 F k , n , 特征函数为外的独立随机变量 X k , n (k = l,2，...，r„) .我 
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们组成行和 5 n = X 1 ,„ + ■•• + X r „_ n , 分别用 C /„ 和 w „ 表示它的分布和特征函数. 
根据 6.3 节中所说明的理由，我们主要对各个分量的影响是渐近可忽略的阵列感兴 
趣.为了保证这一点，我们加上 6.3 节 （3.2) 这个条件：变董 = 

依概率一致地趋于 0. 利用特征函数，这就是说，给定 e > 0和 Co > 0,对于所有充 
分大的 n 有 

|1- 舟 , 》 (C)l<e，ICI < Co, k = l, …, r n . (7.1) 

这样的阵列称为聿阵列. 

实际上 17.1 节和 17.2 节讨论的是分布巧不依赖于 fc 的三角形阵列，这样 
的阵列自然是零阵列.条件 （7.1) 使得我们能利用开头两节所述的理论.特别，现 
在将证明，主要的结果可以搬到任意的零阵列上 I 如果行和的分布老千 一个极 
限，那么这个极哏是无穷可分的 .® 我们将证明一个向指定的无穷可分分布收敛的 
精确准则. 

为了读者的方便，我们回忆一下标准测度的定义.一个测度 M 是标准的，如 
果它对有限区间賦予有限质董 M {/}, 并使积分 


M + (x ) = 


y~ 2 M{dy}, M~(x ) = 


y~ 2 M{dy} 


(7.2) 


对每个 x >0 都 存在. (17.1 节的定义 1.) 
为了简化记号，我们引入由 


M„{dx} 



(7.3) 


定义的测度 M „. 这测度类似于上节中测度按 （7.2) 类推，对 ® > 0, 
我们令 ^ 

fc=i 

M -{ x ) = J ^ F kin (- x ). (7.4) 

*=i 

我们将广泛使用截尾变贵，但是我们将把标准的截尾程序稍作修改，以避免 
由于利用不连续函数而产生的复 杂化. 修改过的程序把随机变量 X 换为截尾变量 
r ( X ), 其中 T 是这样的连续单调函數，使得 


T(a:) = 


|*| < a, 

|i| > a- 


D 关于这个结果对非平稳的独立增傲过 ® 的意义 ，见 17.1 节的结束语. 


(7.5) 
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[显然 r (- x ) = - r ( x ).] 关于截尾变量的期望，我们记 
A, n = E(r(X fcl „)), 

bn = f ： 0 k ,n, B n = ±0l n . (7 . 6) 

fc=i fc=i 

从理论上讲，可以用这样的方式定 X k , n 的中心使所有的汍,„都等于 0. 这可 
以简化论证，但是所得到的准则在许多具体情况下不能直接应有.但是，通常可以 
这样定 X k ， n 的中心使充分地小，以致于 — 0. 在这种情形下，下一定理的 
条件化为上几节中常用的条件 — M . 在一般情形下，对于到原点有一个正距 
离的区间/,我们有 M n { I ) - M { I ], 但是原点的邻域受到 B „ 的影响.（截尾点的 
选取没有影响 .） 

定理设 { X *, n } 是聿 阵列. 如果可以找到这样的常數6„,使得- 的分布赵 
于极限分布 f/, 那么 (7.6) 中的也是如此.①极限分布 J7 是无穷可分的 .® 


为使向一个标准測度为 M 的极限 f / 的收敛发生，当且仅当在所有的连续点 
« > 0上， 



M +( x ) ^ M + ( x ), M ~( x ) ^ 

(7.7) 

并且对于某个《>0, 

M n {- s , a } - B n ~* A /{-«, s }. 

(7-8) 

在这种情形下，5„- 

b „ 的分布超于由 



攸卜 酬 

(7-9) 

确定的特 征兩教 w = 

e * 的分布. 



1条件 （7.8) 在所有连续点上自然成立 . 1 
证我们分步进行 • 


( a ) 首先假设所有的变量 X k , n 是对称的，因此 S „ 的分布一定无需预先经过定 
中心就收敛.特征函数外,„是实的，由 （7.1) 知，只要 n 充分大，泰勒展开式 

- In ¥>«(,„( C ) = [1 - V » k , n ( C )] + |[! - Vfc . nCC )] 2 + … (7.10) 

对任意的€成立.问题是，是不是有 

(7-11) 


① 对于标准截尾，即如果把 t 换成在 |: e | > 0 外等于0的截尾函数，定理仍然成立.为了避免记号的 
复杂化，必须假设 M 在 ±o 上没有 原子. 【证明的 （b) 部分变得更复杂，因为不可能找到这样的 
使得 E( t(X + 灼 ）= 0. 1 

② 集中在一点上的分布是无穷可分的，相应的标准蔺度恒等于 0. 
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(7.10) 中展开式的所有的项都是正的，从而 (7.11) 要求线性项之和是有界的.由 
(7.1) 知，这蕴含高阶项的贡献是渐近可忽略的.由此我们知道，为使 (7.11) 成立， 
当且仅当 

Ebfc . n ( C )- l ]-^ V -( C ). (7.12) 

k=l 

左边可以写成 r n [<Pn - 1] 的形式，其中 A 是分布凡,„的算术乎均的特征函数.于 
是我们讨论的是 17.2 节定理2的一个特殊情形，因此可以断言，为使形如 (7.12) 
的关系式成立，当且仅当存在一个标准测度 M 使得 M „ — M . 当= 0时，条 
件 （7.7) 〜 (7.8) 等价于 M „ — M ; 因为对于一个到原点有正距离的区间八 （7.7) 蕴 
含关系式 M n {/} ^ M { I }. 这就对于对称分布证明了定理. 

( b ) 其次假设对于所有的 A : 和 n ,^,„ = 0. 我们将证明，除非 

_ 1| < C ( C ), (7.13) 

fc=i 

即除非左边之和是有界的，否则 (7.11) 不可能发生.在这种情形下， （7.11) 和 (7.12) 
仍是等价的， （ a ) 中所用的最后论证也把本断言化为 17.2 节定理 2. 固然，这个定 
理涉及一个利用 sini 而不是利用 rOc ) 的中心常数心，但这被极限分布的相应变 
化所抵偿，因为 

H f : — (7.14) 

为了用 (7.11) 推导 （7.13), 我们从因为汍,„ = 0而成立的恨等式 

V > k , n {0 - 1 = [e 1Cl - 1 - iCr (*)] F fc ,„{ dx } (7.15) 

开始.对于 ㈣ < a , 被积函数等于 - 1 - iCar , 并且由 ic 3 ® 2 所控制.因为 
lr ( ar )| < a , 所以 

E -1|< k 2 M n Fo ^} + (2 + o | C |)( M +( a ) + M „_ ⑷). (7.16) 

fc=i 

为了证明 M +( a ) 一定是有界的，我们考虑通过把 { X k , n } 对称化而得到的阵 
列 {° X kl „}. 关于零阵列的条件 (7.1) 蕴含对于充分大的 n , 事件 
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的概率对所有的 k ^ r n 都大于 I 于是⑷<<> M +( a ). 我们知道，如果收敛 
发生，那么后一个量是有界的.我们得到，在收敛的情形下 ， MiHeO + Mf (- a ) 是 
有界的，从而 

E 1^.«(0-1| 2 = . e n ( C ), (7.17) 

k=l 

其中 e „ 表示一个趋于 0 的量.另一方面， (7.15) 中被积函数的实部不改变符号.对 
| x |< a 和充分小的 （， 它的绝 对值〉 jC 2 ® 2 . 从而 

如亡 (¥* fc ， n ( C ) — 1) > 去 C 2 A / n { _ a ， a [ (7.18) 

k=l 

最后这两个不等式表明 (7.11) 的左边不可能是有界的，除非 M „{^> 是有 
界的，在这种情形下 (7.16) 蕴含 (7.13). 

( c ) 我们最后转向任意的零阵列 { X *, n }. 因为 E(r(X k<n -0))^0 的连续单调 
函数，这里5从 a 变到 - a , 所以存在唯一的一个值 0 fc ,„ 使得变撤 V fc ,„ = X k , n -O k , n 
满足条件 E ( r ( n , n )) = 0 .显然， { y fc ,„} 是零阵列，从而定理可应用于它. 

于是我们求出了可能的极限分布的一般形式，但是收敛条件是利用的人 
为地定中心了的分布的测度 N n {dx} = Ex 2 F fc , n {0 fc . n + dr } 来表示的.换句话说，当 
在 （7.7) 和 （7.8) 中把 M „ 换成 AT „, 把 艮换成 0时，我们证明了定理. 

为了消除中心常数我们回忆一下，它们一致趋于0,从而最终有 

M+(x + e ) 彡 N+(x) < M +( x - e ). 

由此推出条件 (7.7) 可相互交换地适用于这两个阵列. 

在讨论条件 (7.8) 以前，我们证明阵列和 { X fc ,„-^, n } 有相同的极限 
分布，即 

b n -J20 k , n ^0. (7.19) 

fc=i 

设= r ( y *,„) - T(X k , n ) + 办,„•由 T 的定义显然可见 Z fc ,„ 等于0,除非 
X kl „ >| a - 0 k ，„\, 并且即使在那里也有 \Z k , n \ $ |办,„| — 0. 因此条件 (7.7) 保证 

E l E (DI = £ — °， (7.20) 


此式比 （7.19) 强. 
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最后我们讨论条件 (7.8). 我们利用符号》表示当《 -> oo 时两边之差趋于 0. 
当 （7.7) 和 (7.20) 成立时，易见 


M n {- a,ai ~ B n 




( x -0 fc , n ) 2 F fc ,„{ dx } 

V 2 F kt n{dy + flfc , n } « JVn {- o , a >, (7.21) 


因此 (7.8) 等价于关于阵列 {n.„} 的相应条件. ► 

例定中心的作用.对于 fc = l , …,《，设服从期望为 n - i , 方差为 n — 1 的正 
态分布.如果把它们的中心定在期望为0,那么极限分布存在，并且是正态的.但是， 
对于中心常数 A：,n = n ~ i , 我们有~ 2 y/n -* oo. 由此推出 M „{- o , a } -» oo .本 
例说明，如果容许任意的中心常数，那么定理的非线性形式是不可避免的.还证明 
了，在这种情形下，只考虑 In 外,„的展开式 (7.10) 中的线性项是不够的. ► 

关于进一步的结果见习题 17 和习题 18. 


*17.8 类 L 

作为上一定理的威力的例证，我们给出一个由 P . 列维发现的定理的一个简单 
证明.我们再一次讨论相互独立随机变董的部分和…，但与 17.5 
节相反， 容许 X „ 的分布依赖于 rz . 我们令匁= ( 氏- 6„)/ o „, 并希望在假设 

—* OO, <l ^ 1 — ♦ 1 (8.1) 

下刻划 { S *} 的可能的极限分布的特征.第1个条件排除了将在 17.10 节中讨论的 
收敛级数 EX *. 由第2个条件所避免的情形最好用下例说明. 

例设服从期望为 n ! 的指数 分布. 令 a „ =»!,&„= 0. 显然，其的分布趋于期 
望为1的指数分布，但是收敛完全是由于项占优势. ► 

遵循辛钦的说法，通常说一个分布爲于类 I ,如果它是一个满足条件 （8.1) 的 
序列 {5；} 的极限分布 ■ 

在这种阐述中，我们不能淸楚地看出•类 L 中的所有分布都是无穷可分的，但 
是我们将把这个结果作为下列引理的推论来证明. 

弓 I 理特征函數 w 属于类当且仅当对于每个 0<«<1, 比 w(C)MsC) 是一个 
特征*数. 


* 本节讨论较专 门的# «. 
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证 ( a ) 必要性.用叫表示 S ；； 的特征函数，设 n > m ■变量 S ；； 是与 
一个只依赖于 …， X n 的变量之和.因此 


W *»(C) = Wm^Om/On) ■ f^ m ,n(C)i (8.2) 


其中 V?m,n 是一个特征函数.现在令 TI 和 m 以这样的方式趋于 OO, 使得 am / On ^ 
s < 1.[由 (8.1), 这是可能的 •] 左边趋于0；(0,右边的第一个因子趋于 wK), 因为 
特征函数的收敛在有限区间内是一 致的. （15.3 节的定理 2.) 我们首先断言， w 没 
有 零点. 事实上，因为 ¥>m,„ 是有界的，所以 w(Co) = 0想含 w(s<o) = 0,从而蘊含 
对于所有的 k > 0,w(«*<o) = 0,而实际上 w(a*Cb) -»1. 于是，比 w(0/w(«C) 作为 
特征函数 Vm.n 的连续极限出现，因此是特征函数. 

( b ) 充分性. 上述论证说明 W 没有零点，从而我们有恒等式 


w (« C ) = w ( C ) 


u;(2Q u>(nQ 

w(C) w((n-l)<) 


(8-3) 


在引理的条件下，因子 u >( kOM(k - 1)0 是一个随机变董&的特征函数，从而 
w ( C ) 是 （& + ••• + 不 •） 的特征函数. ► 

我们不但证明了引理，而且发现 u ; 是一个三角形阵列中第 n 个行和的特征函 
数.显然， w 满足关于零阵列的条件 （7.1), 从而 o ; 是无穷可分的.为了求出确定 w 
的标准测度 M , 我们要注意到比 cj ( OMsC ) 是无穷可分的，正如从因子分解 (8.3) 
所看到的那样.确定 w ( C )/ w (« C ) 的标准测度 AT 与 M 由恒等式 

iV { dx } = M { dx } - 8 2 M { a ~ 1 dx ) (8.4) 

相 联系. 利用函数 M + 和这个关系式可写成 

N + ( x ) = M + ( x ) - M +(®/«), 

N ~(- x ) = M ~(- x ) - M ~(- x / s ). (8.5) 

我们巳经证明了，如果标准测度 M 确定类 L 的一个特征函数 o ;， 那么对每个 
0 < s < 1,在 （8.5) 中所确定的函数 7 V + 和汉-一定是单 调的. 反之，如果这是正 
确的，那么 （8.4) 定义了一个确定 o ；( OMsO 的标准测度.于是我们证明了 
定理 特征*数 w 属于类 L , 当且仅当它是无穷可分的，并且它确定的标准測度 
M 使 （8.5) 中的两个函数对每个固定的 0< s<l 是单调的. 

注容易验证，为使那两个函数是单调的，当且仅当 M +( e *) 和 A /-(- e *) 是凸函 
数. 
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*17.9 部分吸引，“普遍的定律” 

正如我们已经看到的那样，分布 p 不一定属于任一吸引域，这样就产生了一 
个 问题： 在它的逐次卷积序列 { F "*} 的渐近性质中是不是存在一个一般的模型？ 
一个令人沮丧的答案是，实际上每一个可以想象到的性质都可能出现，看不出有什 
么一般的正 则性. 我们之所以讨论几种可能性，主要是由于它们的奇特性质. 

当且仅当存在正规 化常數 Or , ~和一列整數〜4 00,使得 

^7(0 (9.1) 


时，我们称特征函数 p 属于7的部分吸 引域. 这里我们认为 hi 不恒等于1,即相 
应的分布不集中于一点.于是 (9.1) 通过考虑子序列的极限而推广了吸引域的概念. 

由 17.1 节定理2,极限—定是无穷可分的.下列例子将说明两种极端都是可 
能的， 存在不属于任一部分吸引域的分布，也存在属于每一个无穷可分的部分吸引 
城的分布. 

例 （ a ) 17.3 节例 （ f ) 给出了这样一个特征函数 A 它是非稳定的，但厲于它本身 
的部分吸引域. 

例 （ b ) 具有缓慢变化見部的对称分布不爲于任一部分吸 引城. 假设 i ( a :) = 1 - 

F(x) + F(-x) 在无穷远处是缓慢变化的.根据 8.9 节的定理2,在这种情形下， 

U(x) = J y 2 F{dy) = o(x 2 L{x)), x —* oo. (9.2) 

按照 17.7 节的定理， F 厲于某一部分吸引域的必要条件是当 n 跑遍一个适当的序 
列时， n|l - F ( a „ a :) + F (- o „ z )] 和 na ^ U ^ x ) 在所有连续点上收敛.第一个条件 
要求 nL ( o „) 〜 1,第2个条件要求 nL ( an ) - oo . 

例 （ c ) 一个无穷可分的 7 不一定属于它本身的部分吸引城.实际上，由 17.1 节 
定理1推出，如果 P 属于7的吸引域，那么无穷可分特征函数 e ^- 1 也是如此.上 
例说明 eh 1 不属于任一部分吸引范围. 

例 （ d ) 作为叙述以下例子中奇特情况的准备，我们来证明下列命题，考虑任意一 
列具有有界指数的无穷可分特征函数 uv = eh . 令 

入 (0 = ^2^ k ( a k C )/ n k . (9.3) 

fc=i 

可以用这样的方式选取常数 a k >0 和整数 rifc , 使得当 r ^ oo 时对于所有的 C , 
_ n ^/ o ^- WK ) - 0. (9.4) 

* 本节讨论较专门的课 K. 
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证取 { n fc } 为一列如此迅速单调递增的整数，以致于 n fc / n fc _! > 2 fc maxhM •于 
是 （9.4) 的左边由下式所 控制： 

nr £ lV < fc ( Cafc / ar )|+ £ 2- fc . (9.5) 

fc=l fc = r+l 

我们递推地选取系数 知 如下 •令 ai = 1. 若已知 a !,..•, o r _ 1 , 选取 a r 如此 之大， 
以致对所有的 ICI < »•，董(9.5)< 1/ r . 这是可能的，因为第一个和连续地依赖于 C , 
而对于 C = 0 它等于 0. 

例 （ e ) 每个无穷可分特征函數 uj = e * 都有一个部分吸引域.实际上，我们知道 
w 是一列复合泊松型特征函数叫=的极限.用 (9.3) 定义 A , 并令= e > '.那 
么 p 是一个特征函数， (9.4) 说明 

limv? nr (C/ar) = = w(C). (9.6) 


例 （ f ) 变形•设和#是两个无穷可分特征函数，这样选取 (9.3) 中的项，使得 
rhk — a , rhk+i - .由 (9.4) 推出，如果序列 ^ r A ( C / a tr ) 收敛，那么极限一定是 a 
和卢的线性组合.换句话说， e A 厲于所有形如 e »»+^ 的特征函数的部分吸引域，而 
不厲于其他的部分吸 引域. 本例容易推广.利用凸集的术语可以证明，一个分布 F 
可以厲于 n 个指定的无穷可分分布的凸包中的所有分布的部分吸引域. 

例 （ g ) 给定一列无穷可分特征兩數 e ^, e a '.. •，那么存在一个妒 = e \ 它属于每 
个特征函数#的部分吸引城.把整数分成无穷多个子序列.（例如，设第 n 个子序 
列包含所有可被2- 1 整除但不可被 2" 整除的整数 .） 于是我们可以在例 （ d ) 中选 
取这样的使得当 r 跑遍第 n 个子序列时 W 利用这种选择， (9.4) 表明 

¥> = e A 具有所要求的性质. 

例 （ h > 多勃林的“普遍定律 "• 沪可能属于每个无穷可分的 w 的部分吸引城.实 
际上，显然，如果 P 厲于 Wl , W 2, … 的部分吸引域，且 W n 0；,那么 p 属于 W 的 
部分吸 引域. 因为只存在可数多个无穷可分的特征函数，使它们的标准测度集中于 
有限多个有理点上且只有有理质 ft . 因此，我们可以把这些函数排列成一个简单的 
序列 ，…. 于是每个无穷可分的 w 是 { e ° fc } 的子序列的极限.上例的特征函 
数 P 属于毎个〜的部分吸引域，从而也属于 w 的部分吸引域. 

[注.最后一个结果是 W . 多勃林根据辛钦1937年的早期著作，在1940年的一个巧妙 
的研究中获 得的. 那时解决这个问题所遇到的方法上的困难是难以克服的， B . V . 格涅坚 
科， A . 辛钦和 P . 列维在特殊情形下发现了例 （ b ) 的现象.注意一下在正则变化的基本现象 
未被真正理解时特例中所遇到的复杂化将是有趣的 . 】 
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*17.10 无穷卷积 

设…是特征函数为 Vl ,< p 2, ■■- 的独立随机 变量. 和在 (7.5) 中一样， 
我们用 T 表示一个单调连续截尾函数，此函数当 1*1 < a 时由 T(aO = a ; 定义，当 
| x | > fl 时由 r ( x ) = ± a 定义. 无穷卷积的基本定理表明， 部分和 叉 i + … + 的 
分布收敛于一个概牟分布 J 7, 当且仅当 

£ var(r(X fc )) < oo, f ； P{\X k \ > a} < oo, (10.1) 

fc=i fc=i 

且 

^E(r(X fc )) ^ b , (10.2) 

k=l 

其中 6 是一个数. 

8.5 节讨论了有限方差的特殊情形以及例子和应用.此定理以相当一般的形式 
出现在 9.9 节中，其中的结果也可以通过证明级数 EXn 的收敛性（“三级数定理”） 
来推广.我们曾经证明过此定理是三角形阵列的基本定理的一个简单推论，从而无 
需重复论证， ® 因此，我们将满足于说明特征函数的应用的$子. 

例 ⑷均 匀分布的因子分解. 设心 = ±2- fc 的概率都是 I .在 1.11 例 （ c ) 中曾 
非正式地证明了，可以把 E &看作“在1和-1之间随机选出的一个数".这相当 
于下述断言，均匀分布的特征函数 ( sinO / C 是特征函数 cos ( C /2 fc ) 的无穷乘积.为 
了给出一个分析证明，我们从恒等式 

宁=«..0<4.雙 (.0,, 

开始，此式可以按照归纳法利用公式 sin 2 a = 2 sinacosa 证明.当 n -♦ oo 时，最 
后一个因子在任一有限区间内一致地趋于 1. 

注意，偶数项的乘积仍对应于独立随机变童之和.我们从 1. U 节例 （ d ) 知道， 
这个和具有康托型的奇异分布 .® 

* 本节讨论 -- 十专门的 iWB . 

①直接验证条件(10.1)~(10.2)保证乘积 灼… 在毎个有限区间上-致收歎将是一个很奸的练习. 
条件的必要性不是明 fi 的，但是若注意到第 n 行为，太 „ +1 ，…， X „ +r „ 的三角形阵列一定满足 
17.7 节定理的条件（在其中令 M = 0), 就容易推出必要性. 

® G. Choquet 给出了适用于更一般无穷卷积的有®几何证明.在 A. Tbrtrat, J. Math. Pures., 
Appl ., vol . 39(1960) pp .23 X -273 中给出这个证明. 
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(见习题5、习题7和习题 19.) 

例 ( b ) 设 h 具有密度 | e - l * l 和特征函数 1/(1 + C 3 ). 于是 I ： Y k / k 收敛.对于特征 
函数，我们得到 nC / sinluiC 的标准乘积表达式，其中 sinh 表示双曲 正弦. 利用 15.9 
节中的习题8,我们可求出 EnA 的密度为 l /(2 + e * + e -*) = l /4( cosh ( x /2)) a . 

17.11 高维的情形 

本章所述的理论无需本质上的改变就可搬到髙维中去，我们将不给出所有的 
细节.在无穷可分分布的标准形式中，最好把正态分贵分离出来，只考虑在原点上 
没有原子的标准测度.于是只要把以看作 15.7 节中所述那种形式的内积，诸公式 
就不需要改变.为了确定起见，我们详细写出二维的公式. 

在原点上没有原子的测度是标准的，如果它对有限区间賦以有限质量，1/ 
(1+ !? + *!) 关于它是可积的，并且它在原点上没有 原子. 在一维中选取一个适当 
的中心函数，例如 t (; c ) = sin ; r 或 (7.5) 中所确定的函数•令 

觸 = 广一 ㈣ .攀 } ， (11 , } 

积分区域是整个平面，那么 a ; = #是一个无穷可分的二元特征 函数. 最一般的无 
穷可分特征函数可通过乘以一个正态特征函数而得到. 

在极坐标中的重新叙述使情况更为直观.令 

= pco & ip , = x = rcosd , y = rsind . (11.2) 

在极坐标中的标准瀏度可以定义如下.对于每个满足 - n < 0 < ji 的0,选取一 
个集中于上的一维标准测度更进一步在 ji ( 圆周）上选取一个 
有限测度那么 M 可以通过把参数0随机化来定义，并且（把中心常数稍作改 
变）可以把 (11.1) 改写成形式 

^,c 2 ) = jym • I ： ^^)-l-Wr)cos(,- g ) ^ {dr} (113) 

(这种形式使我们能够通过把原点上的原子加到烏中去，而把正态分董吸收 
进来 .） 

例稳定 分布. 类似于一维，我们令 ^ e { dr } = r -^ 1 . 我们可以加上一个任意的因 
子 C e , 但这只改变测度正如我们在 17.3 节例 （ g ) 中所看到的那样，利用这个 
测度， (11.3) 呈形式 

V >( Cx , C2 ) = - Cp a J:\ cos ( v > - 0 )r (1 干 tan 吾) W { d 0}, (11.4) 
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其中当 ip - e > o 时取上面的符号，当#_0 <0时为取下面的符号.这说明#是 
—个严格稳定的特征函数 •和 17.5 节中一样，我们可以看出不存在其他的严格稳 
定特征函数.但是，正如一维情形那样，指数 a = 1导致的特征函数只是广义平稳 
的，并且在指数中有一个对数项. 

当 a = 1 而灰是 均匀分布时，我们得到 R 2 中对称柯西分布的特征函数 e - 邮[见 
15.7 节例⑷和习题21~习题 231. 

17.12 习 题 

1. 在 17.2 节中曾证明，如果分是一个无穷可分特征函数的对数，那么 

V>(0 - a ) dx = x(0 (12.1) 

是一个特征函数的实 倍数. 证明其逆，假设分是这样一个连续函数，使得对于每个 
h > 0, x «)/ x (0) 是一个特征函败.那么 V 与一个无穷可分特征函数的对败只相盏 
一个线性函数.此外於是这样的一个对败，如果它满足进一步的条件岭(0) = 0和 
矽(-0 =丽 

[提示 | 证明齐次方程（其中 X = 0) 的解是线性的 • 1 

2. 证明，如果在 （12.1) 或 (2.13) 中把均匀分布换成集中于点上的分布， 

V-(0- 1 WC + fc) + ^«-fc)] = x(0, (12.2) 

那么习埋1和 17.2 节的论证仍然成立.然而，由于对应于 x 的密度不是严格正的，所 
以可能要稍微复杂一点. 

3. 推广.设 ii 是任意一个具有有限方差的偶概率分布. 如果^ 是一个无穷可分特征函 
数，并且 

X = 矽一 Rirp , (12.3) 

那么 X (0/ X (0) 是-个特征 函数. 若利用 (12.3) 来代替 （2.13), 則 17.2 节的论证仍然 
成立. 

特别，如果丑有密度那么我们直接 导致矽 的辛钦正态形式•（见 17.2 节 
最后的注_ ) 但是，对必是无界这个事实需要小心. 

4. 如果 u ; 是一个无穷可分特征函数，那么存在常败 a 和6,使得对于所有的 C ,| ln «( OI < 
a + 6< 3 . 

5. 真空管中的散粒 哚声. 我们在 6.3 节例 （ h ) 中考虑过一个三角形阵列，其中 X k , n 具有 
特征函数 


¥>*,»«) = l+«/i[e' </( * h) -l], 
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此处 A = n _ l ，\ 证明 •- S n = Xi , n +-+ X n , n 的特征函数趋于其中 
攸 )=«/%•“(*)- 物 . 

#是一个随机变量 X ( i ) 的特征函数，通过微分我们可得到 6.3 节 （3.4) 康 W 尔定理. 

6.设卩= SX n / n , 其中為是独立的，且具有共同密度 ^ e -1- l . 证明£/是无穷可分 
的，具有标准测度 M { dx } = 脾了需要求一个几何级数之和外，不需要 

进行 i+JM 

7•设 P («) = Spy fc ，其中 p fc > 0, E P| , = 1. 假设 P ⑼ > 0， lng 是一个系数全为正的 
幂级数.如果 w 是任意一个分布 F 的特征函数，证明 • P ( v ») 是无穷可分特征函数.利 
用 F "* 表示它的标准测度 M . 

有趣的特殊情形：如果0 $ a < 6 < 1,那么是无穷可分特征函数. 
(见习题19 •) 

8•埃.利用 P 是-个无穷可分整值随机变量的母函数这个事实，借助于随机化和从屑过 
程来解释 P (^). 

9 •设义 是稳定的，具有特征函败 e - |c ' a (0 < <* < 2), 设 K 与； f 独立.如果 y 是正的， 
具有集中于 W 上的分布 G , 证明 • XY l ' a 的特征函败为 

J\' (ry G{dy}. 

证明 I 如果 A •和 y 是其有指羨 a 和0 的》立严格稳定分布，并且 y > 0,那么 XY 1 ^ 
是严格穩定的，具有栺數 c «/3. 

10 . 设 u; 是这样一个特征函数，使得 a> a (C) = u»K) 和 w 3 «) = w(J<) •那么 w 是稳定的. 

[ n .3 节例 （ f ) 表明，第一个关系式是不够的.指数2, 3可以换成任意两个互质的 
整数 .j 

11. 证明， 8.8 节的简单引理3不仅适用于单调函数，而廷适用于特征函数的对败.证明， 
如果对于所有的 n , w „(0= w ( OnC ). 那么对于 C > 0, lnw(O = AC , 其中4是 -• 个复 
常数. 

12. (续)_利用 8.10 节习题 2 8的结果直接 证明， 如果 w 是一个稳定特征函数，那么对于 

C > 0, 或者 lnu»(C) = >l< a +a<, 或者 lnw(C) = -4C + 其中 b 是一个实败 • 

13 •设 F 集中于巧上，且 1 - F(*) = *- 。 1(3 ：)， 其中 0 < a < 1, L 在无穷远处是缓播 
变化的.证明，当 C -» 0+时，1 - 〜 ACHl /0- 

①特征函数 w 被 -- 个无穷乘积所碗定，此无穷乘积正巧是众所周知的 ailCI / e *!^ 的典21乘 
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14•续.由 17.5 节的结果证明其逆，以及 AsIXl - aJe - 1 * 1 / 2 . 

1 5 . 续.对 fe 利用归纳法证明，当 * -» oo 时1 - F (: c ) ~ oc -^ LOc ) (其中 i 是缓慢变化的， 
Kk < a<k + 1 ), 当且仅当 < — 0+时， 

冰 )—— 〜 ACL {\)' W 

那么自然有 A = - aT(fc - a ) e — i *°. 

16. 把三角形阵列的弱定律明确表述成为 17.7 节一般定理的一个特殊情形. 

17. 设 { X fc ,„} 是一个零阵列，它的行和的极限分布是由标准澜度 M 确定的.证明，对于 

* > 0 , 

P { max [ Xi . B ,.-. , X r „，„ l 《 — e - M+ ⑷. 

叙述其逆. 

18. 设 { X *,„} 是-个对称变量的零阵列，它的行和的极限分布是由在原点上具有质搋 a 2 

的标准测度 M 确定的.证明，5? = - tr a 的分布收敛于这样.一个分布，此分布 

由在原点上没有原子的澜度磽定，且使得对于 a : > 0, Af +( x ) = 2 M + ( y / x ). 

19•设0 < < l,&v < 00 . 对于任意的实数〜，无穷乘积 

1 - n _1 -ra 

1 — rie*°i< 1 — rg—aC 

收敛，并且表示一个无穷可分特征函数.（提示^根据习® 7,每个因子是无穷可 
分的 .) 

20. 利用 17.9 节例 （ d ) 的方法构造这样一个分布使得在所有的点上 limsupF "* 

21•在 (11.4) 中，设； y 表示均勻分布，那么 

V -( C «, C ») = - c | C ? + C a 4 ] ,/ao , 

并且#是一个对称的稳定分布. 

22.在 (11.4) 中.设 W 賦予4个点0,«, 的质量都是 I ,那么 （11.4) 表示2个一 

维独立稳定变量的二元特征函数. 

23•在 (11.4) 中，设 IV 集中于两点。和 a + ji 上，那么 (11.4) 表示一对满足 
X \ 8 m<r — Xi cos <t = 0 

的变量的退化特征 函数. 更一般地说，任一离散的 W 都导致退化分布的 卷积. 利用极 
限过程解释 (11.4). 




第 18 章傅里叶方法在随机游动中的应用 

在很大程度上，本章讨论已在第12章中讨论过的课题，因此我们把应用保持 
在最小限度内.为了使本章自给自足并把预备知识控制在最小限度之内（除了第15 
章的傅里叶分析外)，我们做了很大的努力.这个理论和上两章完全独立 .18.6 节与 
前面各节无关. 

18.1 基本恒等式 

本章中…是具有共同分布 F 和特征函数 p 的独立随机变量.我们照 
例令 So = 0,氏=不+ • • • + 序列{5„}构成一个由 F 产生的随机 游动. 

设 A 是直线上的任一集合， W 是它的余集（在大多数应用中， i 将是一个有 
限或无限的区间 .） 如果 J 是 W 的子集（区间)，并且 

SieA ,---, S n _! G ASn €/( IC ^), (1.1) 

那么我们说随机游动在时刻 n (首次）进入，，进入点位于 J 内.因为随机游动在所 
有时刻上可能不进入所以进入时刻 TV 是一个可能为亏损的随机变贵，这对首 
次进入 M S N 也 正确. 对于对偶 ( N , S n ) 的联合分布，我们记 

P{N = n , Sn e 1} = H n { I ], n = 1，2,… • (1.2) 

于是 Hn { I ) 是亊件 （1.1) 的概率，但是分布 (1.2) 是通过下列约定对直线上所有集 
合/都有 定义： 如果 J C 那么 H n { I } = 0. 概率 (1.2) 称为命中概率.对它们的 
研究与对首次进入 I 以前的随机游动（即局隊于>1上的随机游动）的研究有密切 
关系. 对于 /. C >1 和 n = l ,2,.. •，令 

G { I } = P { S 1 € A , -, S„-i eA , S n Gl ), (1.3) 

用文字来说就是，这是在时刻 n 随机游动逗留于集合 ICA 且直至时刻 n 不进入 
A ' 的概率.如果当 J C A 时，令 G n {/} = 0, 我们可以把这个定义推广到直线上的 
所有集合. 

G „{ A } = 1 - P{N ^ n }. (1.4) 
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变量 TV 不是亏损的，当且仅当 n oo 时，这个量趋于 0. 

考虑随机游动在时刻 n = l ,2, ■■- 的位置 S „, 显然，对于 J C A , 


^ n + l {/} = J 


(1.5 a ) 

Gn + l { I } =, 

f G n { dy } F { I - y }. 

(1.5 b ) 


我们现在约定，令 G 0 表示臬中于原点上的概牟分布. 那么关系式 (1.5) 对 n == 
0,1,2,…成立，并且递推地确定所有的概率和 G „. 两个关系式可以结合成一 
个.给定育线上的任一集合，我们把它分成分童和//!,并把 (1.5) 应用于这些 
分量. 我们知道， i ?„ 和 G „ 分别集中于 ，和 4上，所以对 n = 0， l ," •和任意的 
I ,我们有 

H n+l {/} + G n+1 {/}= / G n { dy } F { I - y }. (1.6) 

JA 

12.3 节曾讨论了 A = ^ S 的特殊情形， 12.3 节 (3.5) 关系式和现在的 （1.5) 相 
同.我们可以按照原来的方法推导一个类似于 12.3 节 (3.9) 的维纳-笛普夫型积分 
方程，此方程仍只有一个概率上可能的解（虽然唯一性不是绝对的).但是这次最好 
依赖傅里叶分析这个强有力的方法. 

我们要讨论对偶 ( N , S n ) 的 分布 . 因为 N 是取整值的，所以我们可以利用 7 V 
的母函数和的特征函数.因此，我们令 

X(«,C) = f> n / e^H n {dx}, 

7(», 0 = f> n / e '<* G „{ dx }. (1.7) 

n=0 ■ ，A 

(两个级数的零次项分别等于 0 和 1.) 这些级数至少对 | S | < 1收敛，但是通常在更 
大的区间内收敛. 

为了淸晰起见，我们给出了实际积分域，但是可以给出像 - oo 和+00 —样 
的积分限.特别地， (1.6) 中的积分是普通的卷积.因此，作傅里叶-斯蒂尔切斯 
( Fburier - Stiltjes ) 变换，关系式 (1.6) 就呈形式 


Xn+l(C) + "n+l(C) = Vn(CMC). (1-8) 

用 s " +1 乘以上式，并对 n = 0,1,…求和，我们得到，对于使 (1.7) 中级数收敛的 
所有3,有 


x(*.C) + K*. C)-i = WCMC). 
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因此，我们证实了基本 fe 等式， 

1 - X = ^[1 - > p ]- (1.9) 

(关于另外一种证法见习题6_) 

从原则上讲， X 和^都可以由 (1.5) 递推地计算出来，恒等式 (1.9) 乍一看来是 
多 余的. 实际上直接计算几乎是行不通的，但是可以从 （1.9) 直接得到许多有价值 
的信息. 

例设 F 表示密度为特征函数为 < p ( C ) = 1/(1 + < 2 )的双侧指数分布，并 
设4 .对 I > fl , 我们由 (1.5 a ) 得到 

H n+ i{575o} = H n+1 {-bo,-a:} = ^ G„{dy}e- ( *-») 

= c„e- x , (1.10) 

其中 c „ 与; c 无关.由此推出首次进入 M > a 的点与这次进入的时刻独立，并 
且有一个与(对 ㈣ > a ) 成比例的密度.这个结果在直观上是与第1章所述的 
指数分布的无记忆性 一致. 独立性就是说联合特征函数 x —定可以进行因子分解， 
我们从的密度的形式可以看出， 

1 「 p'o< e -*a< 1 

X (a，0 = ^P(s) [^ + ( 1 . 11 ) 


其中 /> 是首次进入 M > a 的时刻 AT 的母 函数. [比例因子可由 x ( l ,0) = l 这个事 
实确定 

P { s ) 的直接计算是很麻烦的，但是容易从 (1.9) 导出一个明显表达式.事实上， 
利用我们的特征函数的形式， （1.9) 的右边当 C = 时等于0,从而对于这 

个值， X (»，0 必须化为1.因此 


Q—ay/1—s ^ay/1—e 

1 + — 8 + 1 - — 3 


由此推出首次进入 ㈣ > a 的时刻 iV 的期望为1 + a + ia 2 . 
(关于进一步的例子，见习题1 〜 习题 5.) 


*18.2 有限区间，瓦尔德逼近 


定理设4 = =53是一个包含原点的有限区间，并设 ( N , S n ) 是余集倉的到达 
点. 

* 之所以编入本节是由于它在统计学中的重要性，初学者可略去. 
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变量 N 和 S N 是正常的.母 A 數 

s n P{N >n} = f^ s n G n {A} (2.1) 

n =0 n =0 

对某一 a > 1 收敛①，从而 W 的各阶矩都存在.到达点的期望有限，当且仅当 
随机游动的分布 F 的 期望# * 存在，在这种情形下， 

E(S N ) = fi-E(N). (2.2) 

A . 瓦尔德首先讨论了恒等式 (2.2). 在4 =¥的特殊情形下，它化为 12.2 节 

(2-8). 

证正如已经指出的那样，和 P{N > n} 是随机游动持续 n 步以上的概率 
的不同表达式，从而 (2.1) 的两边是恒等的. 

选取这样的整数 》•, 使得 P {|5 r | < a + 6} = »? < 1.事件{况> n + f } 不可能发 
生，除非 

N > n, | X n+ i + ••• + X n + r | < a + b. 

这两个事件是独立的，因为 { N > n } 只依赖于变量因为 X „ +1 + ...+ 
X n+r 与 S r 有相同的分布，所以我们知道 

P {7 V>n + r } < P { iV > n } f /. 

从而利用归纳法得 

P{iV > kr} ^ tj *. (2.3) 

此式说明序列 P{N > n } 至少像有公比 t ? 1 " 的几何级数耶样快地减少.由此推出 
N 是一个正常变嫩， (2.1) 中的级数至少对于 | s | <.r,~ 1/r 收敛.这就证明了第1个 
断言. 

还可推出 （1.9) 对|«| < V ~ 1/n 是有意义的.对于 s =* 1,我们得到 

i - x ( i,Cl = ^( i , C )[ i - y >( C )]. (2.4) 

但是， X (1， C ) 是知的特征函数， X (1，0) = 1这个事实说明 Sw 是正 常的. 

事件 \ S N \>t + a + b 不可能发生，除非对于某个71我们有 TV > n - 1和 
\ X n \ > t . 正如巳经说过的那样，这2个事件是独立的，因为义„是同分布的，所以 
我们得到 


P {\ Sn \ >t + a + b }^ £； P { iV > n - l }- P {\ X r \ > t ] 

n=l 

= E ( N )- P {\ X 1 \> t }. 


①这就是统计学*所熟知的斯坦 （ C . Stein ) 引理.关于另对一•种证明，见习 8. 
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为使期望 A * = E ( Xx ) 存在，当且仅当右边在_上是可积的.在这种情形下，这对 
左边也是正确的，于是 E( S n ) 存在.另一方面， 

P{|%l >*}> P{|-^i| >t + a + b}, 

因为右边事件的发生葱含= Xi . 因此， E{ S n ) 的存在性蕴含 m = E ( Xi ) 的存在 
性.当这些期望存在时，我们可以微分 (2.4) 以得到 

iE ( Sw ) = 占义 1 ) = v ^ OMl , 0) = i / xE ( JV ). ► (2.5) 

我们现在来推导瓦尔德恒等式，它是基本恒等式 (1.9) 的一个变形.为了避免 
使用虚自变量，我们令 

f(\) = J_\- Xx F{dx}. (2.6) 

假设这个积分在包含原点的某个区间内收敛.于是特征函数为 
v ( iA ) = /( A ), 这个函数在给定的区间中的每个 A 的一个复邻域上是解析的.瓦尔 
德恒等式在形式上可通过在 (1.9) 中令 C = iA 和《 = l / v »( iA ) 得到.对于这些特殊 
值,右边等于0,从而 X («,0 = 1•由 X 的定义，这个关系式可以用概率论的术语 
重新叙述如下. 

瓦尔徳 引理① 如果积分 (2.6) 对于 -Ao < A < 收敛，那么在这个区间上， 

E (/- w ( A ) e - A5 ~) = 1. (2.7) 

证我们重复导致 （1.9) 的 论证. 因为测度 G „ 集中于有限区间上，所以它们的傅 
里叶变换对复 T •面上的所有 （ 都 收敛. 根据假设 vKiA ) = /( A ) 存在，从而可见 
(1.6) 的傅里叶形式 （1.8) 对< = LX 成立•乘以 /-"-»( A ), 这个关系式就呈形式 

/ _ n _1 ( A ) Xn + i ( iA ) = /( A )- n »/ n ( iA ) - f-^Wvn+^iX). (2.8) 

如果 /-"( A ) i / n ( iA ) ^ 0,那么因明显地消去一些项而使右边相加得 1. 在这种情形 
下，把 （2.8) 对 n 求和就可导致断言 (2.7), 从而只要证明 

/-"( A ) G „{> l }-.0 (2.9) 

①瓦尔德在序貫分析中利用了 (2.7). 这是在1946年之前，也是在一般随机游动被系统研究之前.因 

此很 自然，它的 条件比较强，他的方法比较难，但是很遗憾它们彩响了统计学 文献. 本书的论证用了 
米勒 （ H . D . Miller )(1961) 的想法. 


就行了.如果 /( I 7) < oo , 那么 
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G n {A} < P{-o < < b > < e (o+6)l,)l - J b 

彡 e («+ b ) l *» l . /"(”). 

因此，如果 /( A ) > f(v), 那么 (2.9) 成立.因为我们可以自由地选取 f ?, 所以我 
们就对除使/取最小值以外的一切 A 证明了 (2.7). 但是因为/是凸函数，所以/ 
至多有一个最小值.在这个点上， (2.7) 可由连续性推出. ► 

例 关于 N 的估计 .瓦尔徳在研究序贯分析中的问題时得到了他的引理，在序贯分 
析中需要求出首次离开>1的时刻 W 的分布的逼近以及这个离开发生于这个区间 
的右端或左端的概率的估计.瓦尔德的方法是第1卷 14.8 节中对具有有限多个跳 
跃的算术分布所述的办法的推广 .( 在那里还说明怎样获得严格不等式 •） 令 

Pit = P{N = k,SN ^ &}, Qk = P{^ = k, Sn 《 -o}, (2.10) 

用 P ( a ) 和 Q(3) 表示相应的母函数 .( 于是 P + Q 是 N 的母函数 •） 现在假设与 F 的 
期望和方差相比 a 和6比较大.于是到达点 S w 可能比较接近于或- a . 如果这 
两个 数是知 的仅有可能的值，那么恒等式 （2.7) 呈形式 

P(l/f(\))e~ Xb + g ( l //( A )) e Ao = 1. (2.11) 

我们自然希望在上述假设下 (2.11) 至少近似地被 满足. 函数/是凸的，通常可以找 
到这样的区间 *0 <«!<«!,使得在其中方程 

sf(X) = 1 (2.12) 


有2个连续地依赖于 s 的根 &(«) 和 A 2 («). 代入 （2.11), 我 们得到母函数 P 和 Q 的 
两个线性方 《,因此我们得到（至少近似地) iV 的分布和离开右端或左端的概率. ► 


18.3 维 纳-霍 普夫因子分解 

在本节中我们用纯分析方法推导基本恒等式 (1.9) 的各种各样的推论.可以证 
明它们包含第12章用组合方法推导的许多结果，而且现在的形式更灵活，更深刻. 
这可能产生这样一个错觉，即傅里叶方法比较优越，但实际上是这两种方法的相互 
影响推动了理论的近代 发展. 每种方法都可导致用另一种方法似乎不可能得到的 
结果 .( 关于说明性例子见 18.5 节，正部分和数的反正弦定律以及整个理论向可交换 
变董的推广说明了组合方法的优点 .） 
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今后尺和 S w 表示 首次进入开的半直线 0^3的时刻 和点. 它们的联合分布 
P{N = n,S N eI} = H n {I} 

为 

H n {l} = P { S ! < 0,…， S „_! ^ O . SnG / J ./ C 0^5. (3.1) 

这里我们认为，丑 0 = 0, 集中于0^5上.代替二元特征函数，跟以前一样，我们 
弓 I 入母函数和特征函数的组合 

X (8,C) = E(« w e i « s ~), (3.2) 

即 。o 

X(«, 0 = X> n /°° e iC *^n{da:}. (3.3) 

(积分是在开半轴上进行的，但是如果把下限换为 - oo , 那么什么也不变 .） 为了简 
明起见，我们称 X 为测度的序列的“变换”. 

我们用和 S N - 表示首次进入开负半轴的时刻和点，于是 {H-} 和 XT 表 
示相应的分布和变换. 

当基本分布 F 不连续时，我们必须区别首次进入开半轴和首次进入闭半轴.因 
此， 需要考虑经 过负值返回原 点这个 事件. 它的概率分布 {/„} 为 

/n = P {5 i <0,- -, Sn -1 <0, s „ = 0}， n 彡 1. (3.4) 

我们令 /(«) = n £/„«"• 立即可见，如果把所有的不等式反向，那么 (3.4) 的右边 
仍然不变 .显然 ' E / n < P{Xl <0}<1. 

利用这些记号，我们现在可阐述基本的 

维纳-霍普夫因子分解定理 对于 M < 1,有恒等式 

1 一 <¥»(0 = [1 一 /(«)]• 01 •[!- x -1 (* i 01- (3.5) 

证明将导致/和 X 的明显表达式，我们以引理的形式来叙述这2个表达式.① 
引理1 对于 0< s < l , 

_㈣ （3 . 6 ) 

①对 < = 0. 引理1化为 12.7 节的定理 1. 推 广了的 12.9 节 (9.3) 形式等价于引理 1. 但是比较笨 
抽. 引理 2重新叙述了 12.9 节 (9.6). 它应归功于 G . Baxter . F . Spitaer , Trans . Amer . Math . 
Soc ., Vol . 94(1960) pp . 150-169 给出了一个大大简化了（但仍比较困难）的 证明. 
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X — 的类似公式可由对称性推出 • 

引理2对于 0< a < l , 

= E ^-P{5n = 0}. ( 3 . 7 ) 

因为右边没有不等式，所以如果把所有的不等式都反向， (3.4) 仍然成立.在 
12.2 节例 （ a) 中作为对偶原理的一个推论导出过这个结果. 

因子分解 （3.5) 的显著特点是，它利用2个集中于两个半轴上的（可能为亏损 
的）分布来表示任意一个特征函数引理1表明这种分解是难一的. 

对连续分布来说证明是简单明了的,但是对于一般情形,我们需要用到关于进 
入闭区间0^的概率的类似于引理1的 结果. 我们将用 Rn { I } 表示这些概率，即 
对于0^上的任一区间 

fln{/} = P{Si < 0,… ， S „_1 <0,5„€/}. (3.8) 

当然办= 0,/?„{^^}=0. 

引理 3 对于 0<s<l, {瓜}的变换/>为 

证我们从把基本恒等式 (1.9) 应用于 A = 5^ 开始. 按照我们记号，进入概率 
是 Bu 而不是队，从而 (1.9) 可写作 

^-^(*.0 =/ Y («. C )[ l - « p ( C )]- (3.10) 

此处7是在=557上由 

G„{I) = P{Si<0,. -,5„_i <0,5„<0,5 n e/} (3.11) 

定义的概率 G „ 的序列的变换，即 

7(*. 0 - 1 = 广 … G„{dx}. (3.12) 

n=l 

对于固定的 H < 1,函数 l - MO 和1 - x («， C ) 不可能有零点，从而（见 17.1 
节} 它们的对数可以唯一地定义为 c 的在原点上等于0的连续函数.因此，我们可 
以把 (3.10) 改写成形式 

ln rr ^( c )= + i n 心，0, (3.13) 
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或者 


°° =n f+oo °° „n 

Et / e '<* F "*{( Lc }= 53 ^ P n (*. C ) 

n=l n J ~°° n=l n 

+ E^W 8 >0- 1 l n - (3-14) 

对于一个固定值 0 < S < 1, 考虑这个关 系式. 于是 p n (8,0 是一个集中于0^上的 
亏损概率分布的特征函数，从而右边第一个级数是一个集中于0^上的有限测度 
的傅里叶-斯蒂尔切斯变换.类似地， （3.12) 表明 p («, C )- l 是一个集中于=35^上 
的有限测度的傅里叶-斯蒂尔切斯变换.因此， [ p ( a , C )- l ] n 也是一个集中干二 
上的有限测度的傅里叶-斯蒂尔切斯变换，从而最后一个级数是二55^5上2个测 
度之差的变换.由此推出，当局限于5^上的集合时， (3.14) 中的前2个级数表示 
同一个有限测度，即 E (« n / n ) f m *- 断言 (3-9) 利用相应的变换重新叙述了这个事 
实. ► 

引理 2 的证明这个引理已包含在引理3中，因此 (3.7) 的两边是两个测度在原点 
上的原子的质贵，这两个测度的变换出现在 （3.9) 中.这对右边显然是正确的.至于 
左边， 根据定义 (3.8), Ru 在原点上的原子的质贵为 /„• 于是/⑷是变换为 p(8,0 
的测度 E « n « n 賦予原点的质童.因此，变换为！： 〆 *(«， C )/ n 的测度对原点賦予质 

»1 ： / n («)/» = Mi-/W)- 1 - 

引理1的证明我们用2种方法证明. 

⑴引理1是引理3对于开半轴的类似结果，完全可用同样的证明.如果把这 
两个引理肴作是已知的，那么我们从 (3.9) 中减去 (3.6) 可以得到 


= /(«) + [1 - /(*)]x(«.C)- ( 3 . 15 ) 

[这个恒等式说明，“首次进入可以是“一次经过负值而返回原点并且当这 
样的返回不发生时，首次进入0^的点的（条件）分布化为首次进入 O^S 的分布 
{ 私 •}■] 

⑻另外，我们可以从和 An 的定义 （3.1) 和 (3.8) 直接证明 （3.15) .[为此， 
只需在 (3.8) 中考虑使 S fc = 0 的最后一个指标 fc < n , 并把 ( fc ,0) 取作新原点 .1 把 
(3.15) 代入 (3.9), 我们作为引理2和引理3的推论而得到引理 1. ► 

因子分解定理的证明把引理1〜引理2的恒等式与引理1关于 ^0 的类似恒 
等式相加，我们得到以对数形式表示的 (3.5). 由连续性可推出 (3.5) 对8 = 1也成 
立. 
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系 

7( *' 0= O ' 

证由 （3.13) 和引理3知， 

7( s ， C ) = exp ^^^- J ° 

根据引理1, (3.16) 和 (3.17) 的右边是恒等的 • 

例 （ a ) 二项随 机游动.设 

P{Jfi = 1} = P . P{Xi = -1} = g . 

首次进入两个半轴必然发生在±1上，从而 

x (*.0 = ^(*) e iC , X "(*. C ) = Q ( s ) e ~ K , 

其中 P 和 Q 是首次进入时刻的母函数.因此，因子分解公式 (3.5) 的两边是3个 
指数 e^(A = 0, ±1) 的线性组合.比较系数，我们得到3个方程： 

[1-/ W ][ l + P («)<5 W 1 = 1, 

[ l - f ( a )] P (8) = 8 P , (3.19) 

[1 - f (»)] Q (») = *9 - 

这导致1 - /⑷的一个二次方程，条件/⑼= 0蘊含/为 

/(*) = - n / 1 - 4 pqs 2 ). (3.20) 

于是母函数 P 和 <3可从 (3.19) 推出.如果 p > g , 那么我们有/( I ) = g , 从而 
(3(1) < 1 • 这样因子分解定理直接导致首次通过时间和循环时间的分布，这些分布 
在第1卷第11章和第1卷第14章中曾用其他方法求出过. 

例 （ b ) 有限算术 分布.如果 F 集中于 - a 和6之间的整数上，那么同样的方法在 
原则上可以 应用. 变换 X ， X - 和/现在可用 a + b+l 个方程确定，但显式解却难以 
获得[见 12.4 节例 （ C )]. 

例 （ c ) 设 F 是集中于两个半轴上的栺數分布的卷积，即令 

p(c) = ttk ' bhc' a>0, 6>0 - (321) 

由于 F 连续，所以我们有 /( s ) 三 0. 因子分解公式 (3.5) 的左边在 C = -沾 上有极点， 
但是 X ~ M 在具有负虚部的任一点 C 旁是正则的 .( 之所以如此，是因为 X - 是一 


(3.16) 

(3.17) 

► 

(3.18) 
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个集中于二35^上的测度的变换 .） 由此推出， x —定具有 W ) = ( i »- iO _1 U («， C ) 
的 形式，其中 C / 对所有的 C 是正 则的. 因此，我们推测 U 与 C 无关，即 x 和 X - 具 
有^式： 

& — 1 ( a + 


为使上式成立，我们必须有 


1 - S (a + iCK6-iC) = ( 1 ~^)(' 


通分并比较两边系数，我们可得 P(a) = Q(s), 且 P(s) 满足一个二次 方程. 条件 
P (0) = 0排除去两根之一，我们最后求出 

/*(«) = Q(a) = ^[o + 6 — y/{a + b) 2 — 4a6«]. (3.24) 

假设 a > &,那么 P ( l ) = b, 从而 P ⑷ /& 和 Q(s)/a 是一个正常概率分布和一个 
亏损概率分布的母函数.因此， (3.22) 中所确定的函数 x 是这样一个对偶 (N，S n ) 
的变换，使得 S / v 与 AT 独立，并且有特征函数 6/(6- iC ). 类似的结果对 x - 成立，由 
因子分解的唯一性， P («)/ b 和 Q(s)/a 确实是首次进入时刻 AT 和 JV - 的母函数.[在 
12.4 节例 （ a ) 中也求出，知和 S N - 服从指数分布.回忆 6.9 节例 （ e ), 形如 (3.21) 
的分布在排队论中起着重要的作用 .1 ► 

关于进一步的例子，见习题9 〜 习题 11. 


18.4 含义及应用 

我们从概率观点来分析上节并说明它和第12章所导出的某些结果的关系. 

⑴对偶性原理.我们首先证明系 (3.16) 等价于 
引理1 对于 W 中任一区间 

P{Si < 5„,…，5„_, < S„,S n € /> 

= P {5 i >0, --,5„_1 >0, S „€7}. (4.1) 

在 12.2 节 （2.1) 中，我们通过以相反次序考虑变童导出过这个事 
实. 以这种方法来考虑，本引理是不言而喻的，但是我们巳经看到许多重要的关系 
式是它的直接 推论. 在利用傅里叶分析讨论时它不起作用，但值得注意的是，它作 
为一个纯分析理论的副 产品出现$ • [为了重新看看引理1关于起伏的奇特的推论， 

①我们的傅里叶分析论《是相当初等的，但墨在历史上《来的维纳 - S 普夫理论是一个出发点.因 
此， 大多数文献利用«深的复变量方法，这在概率论中是不合适的，因为连*来的維纳 -* 普夫方 
法也可以通过局限于正核而大大简化.见 12.3 节中的讨论. 
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读者可参考 12.2 节例 （b).】 

证系 (3.16) 涉及负半轴，因此为直接比较，应把 （4.1) 中的所有不等式都反向. 
于是 (4.1) 的右边的概率与 (3.11) 中引入的概率 G n { I ) 重合， 7 («,0为相应的变 
换.因此，为证明引理，只需证明 [1-X(*.C)] _1 是出现在 (4.1) 的左边的概率序列 
的变换. 

x(*,C) 被定义为首次进入 W 的点 { n , s n ) 的分布的变换，从而 x 1 •是第 r 阶 
梯点 { N r , S Nr ) 的 变换. 由此推出 

T—— - 1 = X + X 2 + ••- (4.2) 

1-X 

是 n 为阶梯时刻且 S n el 的概率的序列的变换.但是，这些概率是出现在 （4.1) 的 
左边的概率，这就完成了证明. ► 

(H) 脅次进入0^5的时刻 AT 的母函数7■为 t («) = X («,0), 于是根据 (3.6), 

■»r^w=|：T p f s » >0 >- ㈣ 

在 12.7 节中曾用组合方法导出过这个公式，在那里讨论了它的各种各样的推论. 
例如，在 (4.3) 中令 s — 1可以看出，为使变 M iV 是正常的，当且仅当级数 
Zn-^Sn > 0} 发散；在收敛的情形下，随机游动趋向 _oo •把 ln(l - a ) = 
-E« n /« 加到 (4-3) 上去，并令 s — 1,我们得到 

lnE(N) = lrn^l) = g ip{S„ ^ 0}, (4.4) 

只要 AT 是正常的.但我们刚才看到，为使最后这个级数收敛，当且仅当随机游动趋 
向 oo ,从而我们有 

引理2 为使 iV 是正常的且 E(N)<oo, 当且仅当随机游动超向 oo. 

这个结果曾在 12.2 节中用不同的方法导 出过. 关于 iV 的分布的其他性质，请 
读者参考 12.7 节. 

(iii) 关于首次进入点的期望•利用第12章的方法得不到多少关于知的分 
布的结论，但我们现在可以在 (3.6) 中令《 = 1而获得知的特征函数.然而最好 
是从因子分解公式直接推导一些有关的知识. 

引理3 如果 S N 和 S N - 都是正常的，且有有限期望，那么 F 的期望为0,方差 
a 2 由下式给出： 

= -[1 - /(1)]E(5 W ) - E ( S n -). (4.5) 

下节定理1说明其逆也是正确的.出乎意料的结论是， F 的二阶矩的存在性是 
保证氏 v 的期望为有限的必要条件. 
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证对于 s = 1,我们从 (3.5) 得到 

1 = [1 - /(i)] y(1, ^ ) ~ 1 • x~U.C)-i 


(4.6) 


当 C — 0时，右边的分式趋于特征函数 x 和 X— 的导数，即趋于 iE(S w ) 和 iE(5 w -). 
因此，左边有有限极限 cr 2 , 这说明 AO) = 0,f^0) = 由此推出 tr 2 是 F 的方 

差（见 15.4 节中的系). ► 

我们转向讨论趋向00的情形.由 18.3 节引理1、引理2和 (4.5) 可推出，在这 
种情形下，当 s-1〆 — 0时， 

[1 - /(*)] _1 [1 - X 、*，。]- 1 - exp (矣 ip { S „ < 0 }^ 

= ~ E ( N ) < oo. (4.7) 


于是根据因子分解定理， 

x(i ， C) vKO-i _1_ 

C 一 C [i-/(i)][i-x-(i,C)]' 

令 C -> 0, 我们就得到重要的结果， 


(4-8) 


E(5jv) = E(Xi) - E ( N ), (4.9) 

只要 ECS W ) 和 E(Xi) 存在（后者是正的，因为假设随机游动趋向 oo). 

我们还可以进一步 讨论. 我们的论证表明，为使 （4.8) 的左边趋于有限极限，当 
且仅当 v^O) = i/x 存在.在 17.2 节中曾证明，为使情况是这样的，当且仅当我们的 
随机游动服从广义弱大数定律，即当且仅当 




(4.10) 


(-^表示依概率收敛).还证明了，对于正变量，这蕴含 p 与它们的期望相等.于是 
为使 (4.8) 的左边趋于一个极限，当且仅当 E ( N ) < oo； 为使 (4.8) 的右边趋于一个 
极限，当且仅当'⑼ 存在. 因此我们有 

引理 4 当随机游动超向 oo 时，为使 E(i\T)<oo, 当且仅当存在一个數 M >0, 使 
得 (4.10) 成立 • 

在 12.8 节中我们只能证明 E(A-x) 存在是充分条件，即使对于这个较弱的结果， 
我们也需用到强大数定律及其逆. 
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18.5 两个较深刻的定理 

为了举例说明更精确的方法的应用，我们推导2个具有独立意义的定理.第1 
个改进了上节的引理3;第2个在排队论中有应用.证明依赖于高深的陶伯定理， 
第2个利用了拉普拉斯变换. 

定理1 如果 F 的期望为 0, 方差为 ff 2 , 那么級數 

f ； i [ p {5 n >0}- i]*c (5.1) 

至少条件收敛，并且 _ 

E (知）= ~^ e ~ e . (5.2) 

这个定理应归功于斯皮策尔.这个级数的收敛曾在 12.7 节和 12.8 节的定理 la 
中起过作用. 

证把 (3.6) 关于 C 微分并令 C = 0,我们得到 

f 厂 • 卿 f - £ ^ P {5 n >0}]. (5.3) 

n=l J0 L n=l J 

两个级数对 k | < i 都绝对收敛，因为，的系数是有界的.实际上，根据中心极限 
定理， S „/( Tv ^ 的阶数彡2的矩趋于正态分布的相应矩，这就是说，当 n - oo 时， 

厂 a : F"*{dxW 居 (5.4) 

因此根据 13.5 节的定理5的容易部分，当 a - 1时， 

(5 - 5) 

(5.3) 的左边趋于 E ( S n ), 它可以是有限的或无限的，但不能为 0. 因此，把 (5.3) 和 
(5.5) 结合起来，我们就得到 

E(5Ar) = ^i^i ^ [£^rG _p{5n > 0} ) j • (56) 

指数趋于有限数或 + oo . 同样的论证适用于 AT - , 即适用于把> 0换为< 0 
的 指数. 但是，两个指数之和等于 E (« n / n ) • P {5„ = 0}, 且当《 — 1时是有界的. 
由此推出， (5.6) 中的指数是有界的，从而趋于一个有限的极限 - C . 因为它的系数 
是 oCn - 1 ), 所以这蕴含 $对于《 = 1,级数收敛于 - a 这就完成了 证明. ► 

①根据基本(尿来）的 (S 伯定理.例如，见 E_ C. Titchmarsh, Theory of Punctioru, 2nd ed., Oxford, 
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其次，我们考虑趋向 - oo 的随机游动，令 

M n = max {0,5 i , …， S n }. (5.7) 


回忆 6.9 节， M „ 在应用到排队论中时表示第 n 个顾客的等待时间.但下述极限定 
理的证明也许比定理本身更有趣. 

定理2 如果随机游动趋向 - oo, 那么 M„ 的分布队趋于一个具有下列特征函数 
w 的极 f 艮分布 

r oo , ] 

w ( C ) = exp - J ( e' tx - (5.8) 


注意，由 (4.3), EP { S „ > 0} < oo , 从而 (5.8) 中的级数对具有正虚部的所有 
C 都绝对收敛. 

证设叫 表示％ 的特征 函数. 我们首先证明，对于 \ 8 \ < 1, 




( e ' c * - l ) F "*{ da :} 


(5-9) 


为使事件 {AC e 发生，当且仅当下列两个条件成立.第一，对某一 0 < n < 
h 点 （ n , S „) 是满足 S n € l 的阶 梯点； 第二，对丁-所有的 n < k < u , Sk - S n ^ 0 . 
第1个条件只涉及 A ，…， X „, 第2个条件只涉及 X „ +1 ，…，忍.因此这两个事件 
是独立的，从而 

P { M „ € /} = aob „ + • • • + a v bo , (5.10) 

其中 

a „ = P{Si < 5„, • ■ • , 5 „_i < S n , S n 6 /}, b „ = P{N > n }. (5.11) 

概率 a „ 出现在 （4.1) 的左边，我们看到它们的变换为的母函数 
为 [1 一 r(«)]/(l - *), 其中 t 由 (4.3) 确定.由卷积的性质 (5.10) ,这些函数的乘积 
表示概率 P { M „ € /} 的变换， (5.9) 只是记录了这个事实. 

我们巳经注意到， （5.8) 和 (5.9) 中的指数对于具有正虚部的所有是正则的. 
因此，对 A > 0,我们可以设 （ = iA , 这导致拉普拉斯变换 

w „( iA ) = jT °° d { da ：} = e -^ f / n ^ dx . (5.12) 

由最大值财„的序列的单调性可以推出，对于固定的: E , 序列 { U n { x )} 递减，从而 
对于固定的 A , 拉普拉斯变换 a ;„( L \) 形成一递减序列.由 (5.9) 我们有，当 s — 1 
时， 
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根据 13.5 节的陶伯定理的最后部分，这蕴含 u ;„( iA ) — w ( iA ). 这蕴含断言的收敛 
U n -> U . ► 


18.6 常返性准则 


本节的内容与上述理论 无关. 它把钟开莱 （ K . L . Chung ) 和富克斯 （ W . H . J . 
Fuchs ) (1950) 发展起来的方法用来决定随机游动是常返的还是瞬时的.尽管有第6 
章和第7章所述的准则和方法,傅里叶分析方法仍有其方法论的意义及历史的意义， 
且目前是可应用于髙维的唯一 方法. 以下/ " 表示一个特征函数为妒 ( C ) = «( C )+ iw ( C ) 
的一维分布 • 

对于0 < » < 1,我们引入有限测度 

U . = ' f ^ s n F n *. (6.1) 


按照 6.10 节所述的理论，为使分布 F 是瞬时的，当且仅当对于包含原点的某一开 
区间八当《 — 1时， U .{ 1 ) 是有界的.在这种情形下，对每个开区间 I , U ,{ I } 是有 
界的.不是瞬时的分布称为常返分布. 

准则分布 F 是瞬时的，当且仅当对某一 a >0, 当 s — 1时， 


Jo (l-«u)2 + a 2 沪 ％ 


( 6 . 2 ) 


是下有界的. 

(即将看到，在相反的情形下，积分趋于 oo .) 

证⑴假设积分 (6.2) 对某一固定的 a > 0 是有界的•把 15.3 节 (3.2) 帕塞瓦尔关 
系式应用于 F"* 和一个三角形密度（表 1M 中第4号分布）可得 

2 /_r 旧 ’*㈣= j - 學 )，(⑽._ 

乘以，并对 n 求和，我们得到 

= o / {} * a) (1 - S « 2 v 2dC _ ( 6 . 4 ) 

(由于 P 的实部是偶函数，虚部是奇函数).设 J 表示区间 |： r | < 2/ a . 对于 xel ,& 
边的被积函数> I 从而 U U { I } 是有 界的. 因此，定理的条件是充分的. 
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( ii ) 为了证明条件的必要性，我们把柏塞瓦尔关系式应用于表15>1中第5号 
分布，此分布的特征函数当 |CI < a 时为1 _ ICI / o - 这把 (6.4) 换为 

对于一个瞬时的左边是有界的，因此积分 (6.2) 是有界的. ► 

作为一个应用，我们证明一个曾在 6.10 节的定理4中用不同方法证明过的引 
理.对于进一步的例子，见习题13 〜 习题 16. 

引理 1® 期望为0的概牟分布是常返的. 

证特征函数的导数在原点处等于0,从而我们可以选取这样小的 a , 使得当0 < 
C<a 时， 

0<1-u(C ) 彡 eC. 

于是 1 - s«(C) 《1 - s + £<, 利用不等式 2|xy| 彡 X 3 + y 2 , 可见 (6.2 ) 中的积分 
、 1 广 （1 - «)dC . ae n 

>3乂 (1-*) 2 +^ = ^ 

右边可以任意大，因此积分 (6.2) 趋于 oo . ► 

准则中的取极限是比较难以处理的，因此知道下列系中的比较简单的充分条 
件是有用的. 

系如果对于每个 a >0, 

£ (l-n/ + ^ AC = 0 °' ( 66) 

那么概牟分布尸是常返的.如果对于某一 o >0, 

(6 . 7) 

那么概芈分布 F 是瞬时的. 

证当 (6.2) 的分子中的1 - su 换成1 - ti , 分母中的换成 t ; 时， (6.2) 中的被 
积函数变小了.于是 (6.6) 可根据单调收敛性推出.类似地，当 (6.2) 中的项 sV 去 
掉时， (6.2) 中的被积函数变大了，于是 (6.7) 可根据单调收敛性 推出. ► 


①钟开莱和 Fuchs 首先 ffi 明了 E(Xj) = 0殖含常返性这个亊实.有趣的是，在1950年，证明 
这个结果却是一个非常难的问踴，许多为解决它而作的努力籌以失败而告终.由于意外地发现了 
P{S„ > n/lmi} - 1的 •'公 平，随机游动，所以人们把 注意力 集中在这个问题上了.见第1卷 10.3 
节和第1卷 10.8 节中的习雇 15. 有关的现象见习題13的脚注. 
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这些准则可以毫无改变地应用于高维中，所不同的只是《和《变成几个变馕 
0的函数了，积分区域变为以原点为中心的球面了.这样我们就证明了下列准则. 
引理2 —个期望为0,方差有限的非退化的二维概率分布是常返的. 

证特征函数是二次连续可微的，由包含两项的泰勒展开式，可见在原点的一个 
邻域内， （6.6) 的被积函数 > 5/( C ? + C !)- 因此，相应于 (6.6) 的积分发散. ► 

引理3 每个非退化的三维分布是瞬时的. 

证考虑 cos ^ Ci + ar ^ + XsCs ) 在原点的某; r 邻域内的泰勒展开式，我们看到对 
于任一特征函数，存在原点的一个邻域，使得在此邻域内 

1 — tt ( CiiCa ， C 3) ^ ^(Ci + Cj + C3 ) - 

因此，类似于 (6.7) 的三维积分被 （<? + C ? + Cl )— 1 在原点的一个邻域上的积分所控 
制，在三维中这个积分收敛. ► 


18.7 习 题 


1 . 在非对称区间的情形下研究 18.1 节的例子 .( 对相应于两个边界的两个母函数推 
导两个线性方程.显式解是很麻烦的 

习超2〜习超5涉及对称二項随机游动，即 v>(0 = coeC. 我们沿用 18.1 节的记号. 

2. 设 A 由两点0, 1组成.利用初等方法来证明 I X (*，C) = (|e~ iC + , 


7(«,0 


. 验证 （1.9). 


3. 如果在上题中把X和 >1' 的作用交换，我们就得到 X(«,C) = 5 e，C + 5^ - 


7(«,C) = 


1 - VI - a 3 


e- ，C 


• 用概率论语言进行解释. 


4. 如果只包含面点，那么 x 只依赖于—定是两个分别关于/和 e _*< 的幂级败 
之和.利用这个侑息从 (1.9) 直接推导 x 和 7. 

5. 如果 W 只包含原点，那么我们有 x = 7 = 1. 

6. 桠等式 (1.9) 的另一种明.利用 18.1 节的记号，证明 

(*)jr»* { / } = / H k {dy}F^*{I -»} + 


(a) 利用直接的概率论证 ，（b) 利用归纳法.证明 •（*) 等价于 (1.9). 

7.在（不一定对称的）二项随机游动的情形下， 18.2 节的瓦尔徳逼近导致一个严格解.证 
明 ■ (2.12) 化成 T=e~ A 的一个二次方程，我们导出的解将与在第1卷 14.4 节 (4.11) 
中知道的解重合.特别，<300 和％ 重合，所不同的是，后者涉及基本区间5^；而不 
是 ^ b , 而且还涉及一个起点 
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8. 和在 18.2 节中一样，设 G„{/} 是 S„ e / C 4且以前没离开过4 的概率.证 

明> 如果两个分布 _F 和在区间|*| < o + 6 内重合，那么它们导致相同的概率 G„. 
利用这点和一个适当的 截尾给 出级数 (2.1) 对某一 s > 1收敛这个亊实的另外一种证 
明. 

9. 12.4 节例⑷曾讨论过这样的随机游动，在其中分布 P 集中于有限多个整数上.证明I 
那里导出的公式蕴含1 - W 的维纳- 霍普夫 分解. 

10. (辛钦- 波拉杰克公式) .设 F 是一个集中于 S^S 上的期望为 1/a 的指数分布与一个 
集中于 ^ 5 上的分布 B 的卷积，用卢表示 B 的特征函数，用-6 < 0表示它的期 
望.我们假设 F 的期望 a- 1 - 6是正的，那么 

1 1 - -- 

注这个公式在排队论中起着重要的作用.关于另一种处理方法，见 12.5 节 （a - &) 
和 14.2 节例 （b). 

11. ( 读）如果 o6 > 1,证明，在0和 a 之间存在唯一的一个正败 /c, 使得 

a 0 (—iK) =a — K. 

证明 ■ x'(i,C) = £ 三手 (C) - 提示：把习题 W 应用于特征函败为 V(0 = v>(C-i«) 

的相伴随机 游动. 注意 X~(1,0=° X~(hC- 12.4 节例 （b).l 

12. 设〜= max[0, Si, - •，5„], V„ = - I/„ .把 (5.9) 所用的论证稍做修改，证明，对偶 

(U n ,V n ) 的二元特征函败是下式中V的系数 i® 

r=7 6X15 £ ^ [/°° (c，<，aE ' l)F"* {d *>] + J° (e' CaI - l)F n *{da:>. 

13. ® 假设在原点的一个邻域内 |1-1P«)| < A-\(\, 那么 P 是常返的，除非它的期望 a * / 0. 

提杀. (6.6) 中的积分大于厂V / 1八 x 2 F{dx). 引入代换 C = 1A 并交换积分次序 
Jo J-i/< 

可以看出，除非 /i 存在，否则积分发散. 


① F- Spitzer, IVaus. Amer. Math. Soc., vol. 82(1956) pp. 323-339 —文首先用分析方法导出了 
这个结果. 

® 这个问《具有理论意义，当¥>在 M 点有导 数时， 就可应用这个结果.我们曾在 17.2 节中肴到，即 
使 F 的期苗不存在，这也是可能的，在 F 的期盥不存在时弱大数定律仍能应用.因此我们得到随 
机游动的一些拥子，在其中对于充分大的 n, S„ > (1 — e)n M (#i > 0) 有很大的槪率，但不趋向 ooi 
随机游动是常返的. 
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14. 利用准则 (6.7) 证明： 如果对某一 P > 0, 当 t - oo 时 t 一 f x 2 F{6x} -> oo, 那么 
分布 f 是瞬时的 .® 

15. 特征函数为 ^(O^e-^l/nlcoeCnlC) 的分布是瞬时的.提示，利用 （ 6.7) 和变量替换 

C = (!/«!)*• 

16. 特征指数为 a = 1 的非对称稳定分布是瞬时的，但柯西分布是常返的. 


①这说明，在较弱的正则性条件下，如果/> < 1阶绝对矩发*,那么尸是鰣时的 .L. A. Shepp, Bull. 
Amer. Math. Soc., vol. 70(1964) pp. 540-542 说明了这个问 ® 在没有任何正則性条件的情况 
下的复杂性. 
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本章补充了第15章所述的特征函数理论，并给出了在随机过程和随机积分中 
的应用 • 19.5 节中的关于泊松求和公式的讨论实际上与其余各节是独立的.整个理 
论与第16章到第18章独立 • 

19.1 帕塞瓦尔关系式 

设£/是一个特征函数为 

O 乂 (1.1) 

的概率分布.把这个关系式关于某一其他概率分布 F 进行积分，我们得到 

厂 '(OndC} = f + °° > p ( x ) U { dx }, (1.2) 

J —oo J —oo 

其中 p 是/' 的特征函数.这是柏塞瓦尔关系式的一种形式 ，15.3 节中的基本结果 
就是由此关系式推导的.十分意外的是，把帕塞瓦尔公式改写成等价形式并考虑其 
特殊情形可以得到许多新的 信息. 一个具有独立意义的简单例子可以说明这个方 
法，这个方法将被多次运用. 

例公式 +0 C 

e_ lo MOF{dC} = J °° < p ( x ) U{a + dx } (1.3) 

只是在记号上与 (1.2) 有所不同.我们应用下述特殊情形： F 是 K 上的均匀分 
布 ，= Bintx / tx . 这个函数的绝对值不大于1,且当 f — oo 时它在所有 i^O 
的点上趋于 0. 因此，根据有界收敛定理，我们有 

t^(a)-(7(a-) = t lim i J ^ e -i<，c w(C)dC. (1.4) 

这个公式可以确定 a 是不是连续点并求出在 a 上的原子的质量（如果有的话) .最 
有趣的结果是通过把 (1.4) 应用于特征函数为 M 2 的对称化了的分布 0 1/ 而得到的. 
如果 PX.P2, …是1/的原子的质董，那么咁在原点上有质贵为 Y . Pk 的原子 (5.12 
节中的习题 11 ), 从而 

‘人 k(C)| 2 dC — 


( 1 . 5 ) 



特别地，这个公式表明，连续分布的特征函数平均说来是很小的. 

帕塞瓦尔公式 (1.2) 的一个可应用于许多方面的变形如下所述. 如果 A 和 B 
是特征函數分别为 a 和 0 的任意概牟分布，那么 
+00 +oo 

JJ u {8- t ) A { ds } B { dt } = j a { x )^) U { dx }, (1.6) 

其中及是卢的共轭.欲直接验证，只需把 

ui{a - t ) = 广 e 1( a -*)* l /{ da :} (1.7) 

关于 A 和 B 积分就 行了. 这个论证使人产生一个错觉，即 （1.6) 比 (1.2) 更一般，而 
关系式 (1.6) 实际上是 相应于 F = A ★一 S 的帕塞瓦尔关系式 （1.2) 的特殊情形，其 
中 - S 是特征函数为万的分布 | 即在所有的连续点上 - B (*) = 1 - 实际上 

F 的特征函数为# =⑯，从而 (1.2) 的右边和 (1.6) 的右边相等.利用两个分布分 
别为4和 B 的独立随机变量 A ■和^最容易看出， （1.2) 和 (1.6) 的左边只是记号 
上有所不同. (1.6) 的左边表示期望 E ( w ( X - y )) 的直接定义，而 (1.2) 的左边则用 
■ X •- y 的分布 F 表示这个期望. 

(我们将在 19.7 节中回过头来讨论帕塞瓦尔公式 .） 

19.2 正定函数 

—个应归功于 S . 波赫纳 (1932) 的璽要定理使我们能够用其内在的性质来描述 
特征函数类.下列简单的准则指明了方法. 

引理1设 w 是在=55^5上可积 ® 的有界连埃（复 值）* 數.把 u 定义为 

u ( i ) = ^ j : e -*«- u ;( C ) dC . (2.1) 

为使 w 是特征函教，当且仅当 w (0) = 1,且对于所有的 x ,«( x ) > 0. 在这种情形 
下， u 是相应于 a ; 的概卑密度. 

证 15.3 节 (3.5) 傅里叶反演公式说明条件是必要的.现在选取具有可积特征函数 
< P >0 的任意偶密度/•用 < p ( tx )^ 乘以 (2.1) 并关于 a : 进行积分.因为 15.3 节 
(3.5) 反演公式适用于对偶/, %所以结果是 

J ^ u ( x ) ip ( tx ) e lax dx = J ^ (2.2) 

® 躍别处一样，这意味着绝对可积性. 
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右边是 w 关于一个概率分布的期望，从而它以 | w | 的最大值为界.对于特殊值 a = 0, 
左边的被积函数是非负的，且当 t — 0时趋于 u ( i ). 因此，积分的有界性蕴含 u 是 
可积的.因此，在 (2.2) 中，令 * — 0,我们得到 

广 u ( i ) e io * da : = w ( o ). (2.3) 

(左边是根据有界收敛性，右边是由于所涉及的概率分布趋于集中在点 a 上的分布). 
对于 o = 0, 我们看出， u 是一个概率密度， w 确实是它的特征函数. ► 

引理的可积性条件看上去很强.事实上，根据连续性定理，为使一个连续函数 
w 是特征函数，当且仅当对于毎个固定的 e > 0, w ( C ) e - e < 2 是一个特征函数.由此 
推出， 为使一 个满足 w (0) = 1的有界连续函数是特征函数，当且仅当对于所有的 * 
和 e >0, 

J e -*<* w ( C ) e- eCa dC > 0. (2.4) 

这个准则是十分一般的，但是不容易应用于各种特殊情形.此外，收敛因子 e- e « a 
的任意选择也是一个 缺点. 因此，我们以如下的形式来重新叙述这个准则，在其中 
条件被加强了 • 

引理 2 为使一个有界 连续* 數 w 是特征函數，当且仅当 w (0) = 1,且对于每个 
概芈分布>1和所有的 z , 

乂: e -'«* a ;( C ) 0 ^{ dC } > 0, (2.5) 

其申 •Us 乂女-/是利用对称化得到的分布. 

证 （ a ) 必 要性. 如果 a 是>1的特征函数，那么 0 A 的特征函数为 H 3 , (2.5) 的 
必要性组含在帕塞瓦尔关系式 （1.3) 中. 

( b ) 充分性 •在 (2.4) 中曾证明，如果把4限制 丁-具 有任意方差的正态分布上， 
那么条件是充分的. ► 

我们曾看到 (2.5) 可以改写成 (1.6) 的形式（其中丑= >!)• 特别，如果4集中 
于具有相应质董为 Pi , P 2, …， p „ 的有限多个点，…， t „ 上，那么 （2.5) 呈形式 

> 0 . ( 2 . 6 ) 

i.fc 

如果这个不等式对0 和巧 的所有选择都成立，那么对于具有有限多个原子的所有 
离散分布 F ，（2. S ) 都成立.因为每个分布都是这样的离散分布的序列的极限，所以 
条件 (2.6) 是充分必要的.令 Zi = Pj e - 气 它呈形式 

tk)ZjZk > 0 . 


(2-7) 
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为了我们的准则的最后阐述，我们引入一个常用术语. 

定义当且仅当对于有限多个实数 tl ,---, t n 和复數 21 ，…，2„的每一种选择， (2.7) 
都成立时，称实变量 i 的复值函数 o ; 为正定的. 

定理（波赫纳）为使一个连续函數 w 是一个概牟分布的特征函数，当且仅当它是 
正定的，且 w (0) = l . 

证我们巳经证明了条件是必要的，也证明了当 w 有界时条件是充分的.利用下 
述引理就可完成证明，这个引理证明所有的正定函数都是有界的. ► 

引理3 对于任一正定的 w ， 


w(0)^0, |w(«)|<w(0), 02.8) 

w (- i ) = w ( t ). (2.9) 

证我们利用 n = 2时的 (2.7), 并令 t 2 = 0,z 2 = \. 去掉不必要的下标，我们得到 
w (0 )[l + \z\ 2 ] + w{t)z + u>(-t)z ^ 0. (2.10) 

对 * = 0可以得到 a ； ⑼彡 0. 对于正的 L 我们得到 (2.9). 由此推出，如果 a ;(0) = 0, 
那么 w 5 0 . 最后，如果 40 ) ^ 0,2 = -^ t )/ u >(0), 那么 (2.10) 化成 |w ⑴卩< 
u^O〉. ► 


19.3 平稳过程 

上一定理在具有平稳协方差的随机过程中有重要的推论.所谓具有平稳协方 
差的随机过程，指的是定义在 -oo < t < oo 上的这样一族随机变董 { Xt }, 具有这 
样的协方差，使得 

Coy ( X , + t , X .) = p ( t ) (3.1) 

与《 无关. 至今我们考虑的都是实随机变世，但是如果我们允许复值随机变贵，那 
么记号就变得更简单更系 统了. 当然，复随机变量只是写成形式 X = t / + iV 的一 
对实变量，对于 t/ 和V的联合分布无需做什么假设.变量 X = y - iV 称为 A •的 
共轭变量，乘积 XX 起在实函数论中 X 2 所起的作用.这就使得方差与协方差的定 
义稍有点不对称. 

定义 对于满足 

E(X) = E(y) = 0 

的复随机 变量， 我们定义 

Cov(X,y) = E(XF). (3.2) 
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于是 VarpQ = E (| X 2 |) > 0,但 Cov ( y ， X ) 是 Cav ( X , Y ) 的共轭. 

定理设 { X t } 是这样一族随机变量，使得 

P{t) = E ( X t + a X ,) (3.3) 

是与 s 无关的连读兩數®.那么 p 是正定的，即 

p ( t ) = J \ iXt R { dX ], (3.4) 

其中是实直线上的一个总质量为 〆 0) 的測度. 

如果变 f 义 4 是实变量，那么測度是对称的，并且 

p ( t ) = J co 8 AtJi { dA }. (3.5) 

证选取任意的实数点 L …， t „ 和复 常数幻 ，…，2„，于是 
tk)zjJk = ^2 E ( X tj Xtk)zjZk 
= ^('£, X tj 2 j X t ^ k ) 

= E (|^；^ il 2 )^0. (3.6) 

从而根据上节的准则， (3.4) 成立.当 p 是实函数时，关系式 (3.4) 对通过把; r 变成 
-*得到的镜像测度也成立.由唯一性知， ii 是对称的. ► 

测度 ft 称为过程的褚測度 ® ,由它的增点构成的集合称为 { X t } 的谱.在大多数 
应用中，变最被这样定中心，使得 E ( X t ) = 0. 在这种情形 下， 〆 t ) = Cov ( X t + Bt X .). 
因此， P 通常称为过程的协方差*歎.实际上 X t 的中心常数并不影响我们即将讨 
论的过程的性质. 

例 （ a ) 设 Z u • • • , Z „ 是期望为0,方差为 ( T ?, • • • , 4的互不相关的随机变量.令 
jr 1 = Z 1 e u > t + -.. + Z n e u -', (3.7) 

其中，…入是实数，那么 

p ( t ) = CT ? e u,t + ■•• + < r * e iAnt , (3.8) 

从而 fl 集中于 n 个点 At ，…， A „ 上.我们即将看到，最一般的平稳过程可以看作是 
本例的 极限情形. 

①连续性是*要的，对于相互》立的变量除 t = 0外， 我们有 p(t)=0, 且这个协方羞函数不具 
有 (3.4) 的形式.见习 * 4. 

® 在通讯工程中也称为，率嫌 



如果过程 (3.7) 是实的，那么可以把它写成形式 


(3.9) 


Xt = Ui cos Xit + • • • + U n cos X r t + Vi sin Ait 
+ … + sin Anf ， 

其中％ 和％是不相关的实随机变世，且 

E (£/?) = E (^) = 4 

一个典型的例子出现在 3.7 节 （7.23) 中.相应的协方差是 〆 t ) = o ? co 8 A 1 t + ...+ 
cosA r t . 

例 （ b ) 马尔可夫过程. 如果变量是正态的，过程是马尔可夫过程，那么 P ( t ) = 
[见 3.8 节 (8.14)]. 谱测度与柯西密度成比例. 

例 （ c ) 设不 = Ze itY , 其中 y 和 Z 是独立的实随机变 M , E ( Z ) = 0,那么 

p ( t ) = E ( ZZ ) E ( e iir ). 

此式表明谐测度 a 为 y 的概率分布乘以因子 E ( zi ). ► 

在理论上，过程是用它的协方差函数 p 推述的还是用它的相应谱测度 ji 描述 
的是无关紧要的，但是在实际中利用谱测度来描述通常是比较简单比较可取的. 
在应用于通讯工程时，谱测度在仪器测试 和测撤 中有技术上的优点，但是我们不详 
细研究这个问题.从我们的观点来看，具有重要意义的是，利用比利用 p 更容易 
描述变董 x t 的线性运算（通常称为“墟波器”). 

例（<0 线性运算.作为一个最简单的例子，考虑一族由 

= 〉: (3.10) 

定义的随机变置其中 Cfc 和 n 是常数 （ n 是实数)，和是有限的 • y t 的协方差函 
数是二重和， 

py (*) = -tj + Tk ). (3.11) 

代入 （3.4), 我们求得 

PY { ' t )= 1-2 iE c J e ~ iT , A i vtAfi ( d；x }- 

这说明谱测度 Ry 由 

iiy { dA } = 1^ (3.12) 

确定.和 (3.11) 相反，这个关系式有一个直观的 解释： “频率” A 受到 -频率 响应因 
子” /( A ) 的影响， /( A ) 依赖于给定的变换 (3.10). 
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这个例子的应用范围比乍一看来要广泛得多，因为积分和导数都是形如 (3.10) 
的极限，因此类似的陈述也适用于它们.例如，如果是一个标准电路的输入，那 
么输出 R 可用包含的积分来表示，谐测度 flr 也可用 fl 和频率响应来表示. 
后者依赖于电网的特征，我们的结果可以应用于两个方面，即用于描述输出过程， 
也可用来构造这样的电网，使其产生一个具有某些指定性质的输出. ► 

我们转向我们的定理的逆，并证明，给定直线上的任一測度 ii , 存在一个错測 
度为的平穗过程 { X t }. 因为映射把 fl 变成 a 2 R , 所以不失一般性可 
设是一个概率测度.我们取具有概率测度的 A 轴作为样本空间，并用表 
示由 X t ( A ) = e» A 定义的随机变那么 

〆 *) = ^{X t+t X a ) =厂 ^ tX R{d\}, (3.13) 

从而我们的过程的谐测度为兄因此，我们构造了一个具有指定的谱測度的平穗过 
程的显式 模型. 出乎意外但令人满意的是，这样的模型对于以实直线作为样本空间 
的情况是可能的.我们将在 19.8 节回过头来讨论它. 

容易改变这个模型，以便得到期望为0的 变筐. 设 F 是一个与所有的 A ■，独立的 
随机 变童. 并且取值±1的概率都是 f 令 X t ' = YX t , 那么 EpQ = 0, E ( X t VX ) = 
E ( y 2 ) E ( X t +4 A r ,). 因此， {&} 是一个期望为 0 的平穗过租， (3.13) 表示它的其实协 
方差函數. 


19.4 傅里叶级数 

—个对点 n 賦予概率的算述分布具有周期为 2 n 的特征函数 

¥>(0 = ^^ne inC . (4.1) 

概率可以用反演公式 

<Pk = ‘J e _ifcc ^(C)dC (4.2) 

表示，这容易由 (4.1) 验证[见 15.3 节 （3.14)1. 

我们现在从周期为如的任一函数 p 开始，并用 （4.2) 定义办 . 我们的问题是 
决定 < P 是不是一个特征函数，即 Wn } 是不是一个概率 分布. 方法依赖于对一族函 
数 / r (0 < r < l ) 的性质的研究，八是由 


/r(C) = E^r |n| e in < 


( 4 - 3 ) 
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定义的.尽管它非常简单，但利用同样的论证将得到关于傅里叶级数和集中于有限 
区间上的分布的特征函数的重要结果. 

在下文中最好把基本区间看作是一个圆（即把点 n 和 - Jt 视为一点). 
对于可积的 A 数 办称为 V 的第 k 个傳里叶 系数. 出现在 (4.1) 中的级数是相应的 
“形式上的傅里叶级数”.它不一定收敛，但是因为序列 { v »„} 是有界的，所以级数 
(4.3) 收敛于一个连续（甚至可微）的函数 / r . 当 r — 1时，即使 (4.1) 中的级数发 
散，•也可能趋于一个极限也在这种情形下，我们说级数是“阿贝尔可和的”，其 
和为也 

例⑷对 n = 0, l ,2, …设 = p „ = l ; 对于 n <0, 设％ = 0. (4.1) 中级数的每一项 
的绝对值都是1,从而级数对于任一值 C 都不 收敛. 另一方面， (4.3) 的右边化为几 
何级数，此级数收敛丁 • 

= t-reif ( 4 . 4 ) 

当 r — 1时，对于除 C = 0 外的所有点，极限都存在. 

例 （ b ) (4.3) 的一个重要特殊情形可用函数 

P*-W = ^E rWe ' nt (4-5) 

表示，此函数是当对 T 所有的 n , % = l /(2: t ) 时得到的. (4.4) 中计算了满足 n^O 
的项的贡献.由对称性我们得到 

加办⑷= + _1 « ( 4 - 6 ) 

或者 2 

( 4J ) 

在调和函数论中经常使用这个 函数. 在这个理论中， Pr ( t - C ) 称为“泊松核”.为了 
便于参考引用，我们把它的主要性质叙述在下列引理中. 

弓 I 理对于固定的 0< r < l ， 函數 p r 是圓上的一个概率分布 p r 的密度.当 r-»l 
时，分布 Pr 超于集中在原点上的概牟分布. 

证显然 Pr > 0•从 (4.5) 显然可见， p r 在上的积分等于1;因为对于 
n # O . e 1 "* 的积分等于0•对于 d < t < n , (4.7) 的分母的值是0以外的有界值.由 
此可推出，在不包含原点的任一开区间中，当 r — 1时有界地有奸⑷ - 0,因此 
Pr 有一个集中于原点上的极限分布. ► 

定理1 一个周期为 2 ji 的连续函教是一个特征 南数， 当且仅当它的傅里叶系數 (4.2) 
满足办 >0和 vK 0) = l . 在这种情形下，沪可用一致收敛的傅里叶級數 (4.1) 表示. 
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[换句话说，为使具有非负系数仰的形式傅里叶级数收敛于一个连续函数，当 
且仅当 Y / Pk < oo . 在这种情形下 (4.1) 成立 . 1 
证由 （4.2) 和 (4.5), (4.3) 中的函数 / r 可以写成形式 

/ r ( C ) = /"^(0- Pr(C -*)«!*• (4.8) 

右边是 W 与概率 分布朽 的卷积，因此我们知道， 

/ r ( C ) - < p (0, r —1. (4.9) 

此外，如果 m 是 M 的上界，那么根据 (4.8), 

+oo 

厶⑼= m . (4.10) 

由于级数的各项是非负的，所以令 r — 1可得 5 >n < m . 因此， J ： ip n e in < 一致收 
敛.从 (4.3) 显然可见， MC ) 趋于这 个值. 因此， (4.1) 成立，这就完成了证明. ► 
注意， (4.9) 是卷积收敛性质的一个直接推论，从而与系数的正性无关.因 
此，作为一个副产品我们有 

定理2①如果#是连续的，且有周期 2 jc , 那么 （4.9) 对(：一致地成立. 

(关于向不连续函数的推广，见系2和习题6 〜 习题 8). 

系1 ( fr 耶尔 ( F 6 jer )) 連埃 周期* 數 v ? 是一个三角多项式序列的一致极限 • 

换句话说，任给£>0,存在这样的数 a - w , …，叫,使得对于所有的 C , 

N 

|^(0- 5 Z °« e 叫 < e . (4.11) 


证对任意的 N 和0 < r * < 1， 

MO- E ^nr |n 'e in «| < |v»(C) - /r(C)l+ E IVnl-rW. (4.12) 

n=-N | n|>N 

我们可以选出如此接近于 1 的 》•， 以致于对所有的 C, 右边第一项< e/2. 选取了 》• 
后，我们可以选取这样大的乂使 (4.12) 中最后一个级数之和< e/2. 于是 (4.11) 
对 a n = < PnT ^ 成立. ► 

①这个定理可以*新叙述如下，一个 连缕周 期函败 V 的傅里叶级败是阿贝尔可和的，其和为 V . 定 
理（及其 证法） 同样适用于其他可和性方法. 

费耶尔 ( L . F « jer ) 在发《级数似乎是很神秘的时候，利用切萨罗 （ Cesaro ) 可和性(见习》 9) 
首先 发现了 上述*象.因此，这个发现: ft — 个轰动 一时的事情.由于历史的®因，许多书中仍利用 
切萨罗可和性，虽然阿贝尔方法更加方便且可统一证明. 
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下列结果只是为了完整起见而叙 述的. 它实际上包含在 19.6 节引理1中. 

系2 两个具有相同的傅里叶系數的可积 周期* 数至多在測度为0的集合上不同 
(即它们的不定积分是相同的). 

证对于一个傅里叶系数为的可积周期函数令 

Hx)- J \v>{t) - (4.13) 

这个#是一个连续周期函数，分部积分表明对于 n #0, 它的第 n 个傅里叶系数等 
于 - i ^ n / n . 

关系式 （ 4.9) 和 (4.3) 合在一起表明，一个连续函数^被它的傅里叶系数•唯 
一确定.因此，满足 》 » 卢 0的系数 如 (除一加法常数外）确定了 对于任意一个可 
积的 A 由此可推出它的傅里叶系数确定了积分宄从而（除了在一个测度为0的 
集合之外）确定了 # ► 


*19.5 泊松求和公式 

在本节中 ， v 示这样一个特征函数，使得 M 在整个直线上是可积的.根据 
傅里叶反演公式 15.3 节 (3.5), 这 逋 含存在一个连续的密度 /. 根据 15.4 节的 黎曼- 
勒贝格引理3, /和 p 在无穷远处都等于 0. 如果#充分快地趋于0,那么可以利用 
它通过下列方法构造周期函数，这种可以粗略地说成是把 C 轴绕在一个长度为2入 
的圆周上.新的函数可以表示成形式 


妒 (0 = I>(C + 2 U ). (5.1) 

(此处双重无穷级数之和 EiT - ocfl * 被定义为如果这个极限存在的 
话 .） 在收敛的情形下，函数中显然是一个周期为 2 A 的周期函数.具■有最简单概率 
形式的泊松求和公式断言，当故连续时，利0/训0)是一个算术概芈分布的特征* 
數，此分布在点 rwt/A 上的原子的质量与 /(nai/A) 成比例.（此外 n = 0，± l ，±2...). 
乍一看来，这个结果只是一个奇特的结果，但是它包含了通信理论中的著名抽样定 
理和许多相当有趣的特殊情形. 

泊松求和公式® 飯设特征函數 p 是绝对可积的，从而相应的概率密度/是 

* 本节讨论一个重®的特殊》题.在后面用不 a 它，并 a 除7■利用 19.4 节定理1外，它与前面各节无 
关. 

①恒等式 (5.2) 通常是在各种各样 的附加 条件下证实的.对/的正性的系统研究使我们的《单叙述及 
其大大筒化了的证明成为可能.关于定理及其 a 明的变形，见习題12和习题 13. 
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连渎的，那么 

^^(C + 2 fcA ) =这 nrm /\) e in ^ t (5.2) 

只要左边的級数收敛于一个连续函数也 
对于 C = 0, 这蕴含 

2 V >(2 fcA ) = ( n / A ) 乙 /( rni / A ) (5.3) 

是一个正数木从而 视 VA 是一个特征函数 • 

证只需证 (5.2) 的右边是左边的周期函数少的形式傅里叶级数，即 

士广 V >( Oe- ln(a/A)< dC = lf ( rui /\). (5.4) 

事实上，这些傅里叶系数是非负的，由假设是连续的.因此根据上节定理1,傅 
里叶级数趋于也从而 (5.2) 成立. 

V - 的级数 (5.1) 的第*项对 (5.4) 左边的贡献等于 

A f\(C + 2 kX ) e - in ^ f^dC = ^ / (2 * +1)A < p ( s ) e - ln ^ ds , (5.5) 

认 J -\ 从 J ( 2k - l)X 

它的绝对值小于 

r hl)* 

l ^(«)| d «- (5-6) 

1)A 

区间 （2 fc - 1 )A < * < (2 fc + 1) A 覆盖了实轴但互不相交，从而把 （5.6) 的数值相加 
得到 M 的积分，这积分是有限的.因此，在 -JV < fc < 况上求 (5.5) 的和，并令 
N ^ oo , 我们根据控制收敛性得到 

去乂二 ^( C ) e -'»(»/* Kd < = ^ 仁 ^ e -^^ da . (5.7) 

根据傅里叶反演定理，右边等于 («/ A )/( nn / A ), 这就完成了证明. ► 

最有趣的特殊情况发生在妒对于 |CI > a 恒等于0的时候，其中 a < A . (5.1) 
中的无穷级数化为一项， 錢是中 的周期为 2 A 的周期延拓.于是 (5.2) 成立.在 
(5.3) 中左边化为1,这说明少是一个概率分布的特征函数.因此，我们有 
系如果一个特征函数对 | C | > a 恆等于 0, 那么它的周期为 2 A > 2 a 的所有周期 
延 4s 也是特征函数. 



*19.5 泊松求和公式 567 


这个系实际上比通常在通信工程教科书中所述的“抽样定理”稍微深刻点 ®, 
抽样定理有时也称为尼奎斯特 （ H . Nyquist ) 定理或香农 （ C . Shannon ) 定理. 

“抽样定理” 一个使得其 特征* 数 p 在外等于0的概率密度 / 被值 
(ji/A)/(njiya) 唯一确定®,其中 A>a 是任一 BI 定的数， n = 0,±l,- -. (这些值导 
出一个这样的概牟分布，其特征*敷是的周期为 2 A 的周期延拓 •） 

例⑷考虑密度/⑻= (1 - cosx)/(jix 2 ), 它的待征函数当 |CI < 1 时等于 
^( C ) = i - ICI , 当 ICI > 1时等于0•对于 A = 1和< =1,注意到/⑼= l /(2 jt ), 我 
们从 (5.3) 得到 

9 的周期为 2 A = 2的周期延拓的图像是 15.2 节的图 15*2, 周期为 2 A > 2的 
延拓的图像是图 15*3. 

例 （ b ) 关于 (5.2) 的简单例子，见习题 11. ► 

在类似的情况下，公式 (5.2) 照例可以改写成似乎更一般的形式.实际上，把 
(5.2) 应用 于密度 /(* + *), 我们得 到泊松求和公式的另一形式 

2 *^(C + 2 fcA ) e - u < c+3fcA > = ^£/( n ^ + (5.9) 

例 （ c ) 把 (5.9) 应用于正态密度，只利用特殊值 C = A , 我们得到 

g e - i (狄 + W cos (2 fc + l ) A S =^ + a ). (5.10) 

这是0函数论中的一个著名公式，在 10.5 节中曾用更初等的方法证明过.事实 

① a 常之所以引入不必要的条件，是由于证明依赖丁-标准傅里叶理论，此運论忽略了与槪率论有密切 
关系的/的正性. 

® fix ) 的明 ft 表达式可以推导 如下. 对于 Id < A, 我们有 v(C) = rl >( 0 . 从而根据傅里叶反濟公式 
/(*) = ±/ ； -*K).-«dc. 

矽由 (5.2) 的右边给出，利用简单的积分可导出最后的公式 

3 §/„>(■!) w 、■ 亨 | H " s ) 黑. 

这个臊开式有时称为 ■■基 本级败 •. 它有许多应用1见丄 M. Whittaker, Interpolatory function 
theory, Cambridge TVacts No. 33, 1935 中的定理 16_ 关于高维中的类似*开式，见 D. P. 
Petersen and D. Middleton, Information and Control vol.5(1962),pp. 279-323.) 
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上，关于： r 微分表明， 10.5 节 (5.8) 和 10.5 节 (5.9) 的恒等式等价于具有 A = ( n / a )^ 
和 s = x / y/tify (5.10). 

例 （ d ) 对于特征函数为 p ( C ) = e - | cl 的密度/⑷=«-»(1 + 1 2 )' 1 , 我们在 （5.2) 
中令 （= 0 得到， 

-A 4- +2? \ 

e A_ e -A = g A 2 + „2 n 2. ( 5 . U ) 

这是双曲余切的部分分式的分解式 • 

例 （ e ) 长度为 2 n 的圓周上的密度可以通过把实轴绕到圆周上得到，这巳在 2.8 
节中叙述过.对于直线上的一个给定的密度/，在圆上有一个由级数 E /(2 «n + «) 
给出的相应密度，由 C = 0 时的 (5.9), 我们得到这个密度的一个用原来的特征函数 
表示的新表达式.在 / = n 的特殊情况下，我们得到下列形式的单位圆周上类似于 
正态密度的表达式 ■ 


▲E 卿 (-^( fl+2 仰 ) 2 ) = ^ E e_i " atcos 似. ( 6 . 12 ) 


第2个表达式显然说明，参数为 h 和 t 2 的2个正态密度的卷积是一个参数为 h +* 2 
的正态密度. ► 


19.6 正定序列 


本节讨论有限区间上的概率分布.为了确定起见，把它的长度取为 2 n . 和在 
19.4 节中一样，我们把区间的两个端点视为一点，并把这个区间看成是单位圆周. 
因此，我们可以把 F 看成是单位 B 周上的概率分布，并把它的傳里叶系數定义为 

外=基厂 e~ lkl F{dt}, k = 0,±l,- -. (6.1) 

注意， lp k = < p . k . 现在我们来证明系数外唯一地确定分布.考虑到不足道的尺度 
变化，这个断言等价于如下的断言：集中于 U 上的分布由它的特征*数在 n / 入 
的倍數上的值 V ( tm / X ) 唯一地确定.这个断言是上节抽样定理的对偶定理.按照 
该定理，在外等于0的特征函数由密度的值 f(rm/X) 唯一确定. 

定理1圓周上的分布 F 由它的傅里叶系數外唯一确定. 

证和在 (4.3) 中一样，我们对0 < r < 1令 

fr«) = T,VnT^- e in <. ( 6 . 2 ) 



导致 (4.8) 的简单计算说明，现在有 

/r(C) = £ Pr(C ~ t ) F { dt }, (6.3) 

其中 IV 表示 (4.7) 中所定义的泊 松核. 我们知道，外是一个密度，我们用 P r 表示 
相应的分布.于是 / r 是卷积 PrirF 的密度，此卷积当 r — 1时趋于因此 F 实 
际上可利用 / r 来 计算. ► 

引理 1 设 {¥>„} 是任一有界复數序列.为使在圓周上存在一个傅里叶系数为外》 
的測度当且仅当对于每个 r <1, (6.2) 所确定的函數 / r 是非负的. 

证由 （6.3) 和 p r 的严格正性，必要性是显然的•用乘以 (6.2) 并积分可得 

^• r' n l = ^ y " a / r ( C ) e - , fc « dC . (6.4) 

对于特殊值 A: = 0 , 可见仰 > 0. 不失一般性，我们可以假设 仰 =1/(2«). 利用这 
个正规化常数， / r 是圆周上一个概率分布 F r 的密度， (6.5) 表明外 rW 是 i = V 的第 
k 个傅里叶系数.根据选择定理，可以令 r 以这种方式趋于1, 使得仄 收敛于一个 
概率分布 R 由 (6.5) 显然可见外满足 (6.1), 这就完成了 证明. ► 

注意，这个引理比 19.4 节系2强.我们如同在 19.2 节中那样进行，推导一个 
对应丁•波赫纳定理的定理，这应归功于赫格洛茨 （ G. Herglotz ). 

定义称一个序列为正定的，如果对于有限多个复教 21, ---.zn 的每种选择， 

y^.Vi-kZjZk > 0. (6.5) 

引理 2 如果 { v ?*} 是正定的，那么 仰 > 0, 且 |<^ n | < 仰. 

证应用 19.2 节引理3的证明（又见习题 14.) 

定理 2 为使序列是圓周上一个測度 F 的傅里叶系數，当且仅当它是正定 
的 • 

证 （ a ) 通过简单的计算可以证明，如果外由 (6.1) 给出，那么 (6.5) 的左边等于 
关于 F 的 积分. 因此，条件是必要的. 

( b ) 为了证明充分性，对 fc > 0选取= r k e ikt , 对 fc < 0选取= 0. 对于这 
个序列， (6.5) 中的和呈形式 

£ ^ ne int f ； rl " l +2fe 

j=0 k =0 n=-oo fc =0 

= ( l - r 2 r 1 E ^ Weint - 


( 6 . 6 ) 
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根据定义 （6.2), 最后一个和等于 f r ( t ). 固然，不等式 (6.5) 只是对有限序列 { z „} 
而假设的，但是简单的取极限表明，它对我们的无穷序列也成立，于是我们证明了 
fr ( t ) > 0. 根据引理1,这蕴含 ¥»„确 实是单位圆周上一个测度的傅里叶系数. ► 
由这个准则我们推导一个类似于 19.3 节定理的 
定理 3 设 { X n } 是定义于某一概率空间上的一列随机变量，使得 

Pn = E ( x „ 抑 D (6.7) 


与 w 无关，那么在圓周 '- n,n 上存在唯一的一个測度 il , 使得 p n 是它的第 ri 个傅 
里叶系數. 

证显然， _ 

E Pi -^ = E nXjZjXkZk ) = E (| X ； XjZjl 2 ), (6.8) 

这说明序列 { p „} 是正 定的. ► 

其逆也成立：对 f 圆周上任一测度，存在一个序列 { X n }, 使得 (6.7) 是它的傅 
里叶系数.这可由 19.3 节末尾所用的构造看出，但是我们将在 19.8 节回过头来讨 
论这个问题. 

例 （ a ) 设是独立同分布变世，满足 E ( X „) = m 和 Var ( X n ) = a 2 . 那么 
Po = ^+^, 且对于 k 爹 0, Pk = fA 请測度是在原点上具有重董 / i 2 的原子与密 
度为^ 2 /(2«)的均匀分布之和. 

例 （ b ) 19.4 节中的构造说明，对固定的 r < 1和0,由 p r (t - 0) 定义的密度的傅 

里叶系数为 Pnsrlnle 1 "*. 

例 （ c ) 马尔可夫过程.在 3.8 节中曾证明，实正态变童的平稳马尔可夫序列具有 
形如办= rW 的协方差，其中0 < r 矣 1. 类似的论证表明，任意复平稳马尔可夫 
序列的协方差具有 rl " le in <, 的形式.当 r < 1时，港测度有密度; v(t _外,当 r = 1 
时，它集中于点0上. ► 


19.7 _ L 2 理论 


为了概率论的目的，需要把特征函数作为测度的变换而引入，但是研究调和分 
析的其他方法也是同样自 然的. 特别，可以定义函数（而不是测度）的傅里叶变换， 
由傅里叶反演公式，似乎可以用这种方法获得较好的对称性.事实上，当只讨论平 
方可积函数时，得到的结果最简单最优美.我们之所以研究这个理论，是由于它本 
身的重要性，也是因为它被广泛地应用于随机过程的调和分析. 

对于实变量2：的一个复值函数 U ， 我们把范数 || U || > 0定义为 

ll U ll = / oo 卜⑽ 2 * 3 ^ 


( 7 . 1 ) 
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我们将把两个只在一个測度为 0 的 集合上 不同的 函數看 作是恆等的. （换句话说，我 
们实际上讨论等价函数类，但是我们仍沿用通常的语言，这并无害处 •） 利用这个 
约定，为使 IMI = 0 , 当且仅当 « = o . 用 P 表示所有的范数为有限的函数类. 
L 2 中两个函数的距离是以||«-«||定义的.按这个定义， L 2 是一个度童空间， 
称 L 2 中的函数 U „ 的序列依这个度童收敛于 li , 当且仅当 IK - ull ^ O . 这种收 
敛$将 表示为 u = l . i . m . u „ 或 Au . 它也称为均方“收敛”.称 { u „} 是一个柯西 
序列，当且仅当 

||ttn - « m || 0,当 n , m -* ooii . 

我们不加证明地指出，在毎个柯西序列 {«„} 都有唯一的极限 uet 2 的意义上，度 
M 空间 L 2 是完备的. 

例 （ a ) I ? 中的函数 U 在每个有哏区间上是可积的，因为在所有的点上 | u (*)| < 
|«( x )| 2 + 1. 这个陈述对无限区间不成立，因为 （1 + W )- 1 在 L 2 中但不可积 • 

例 （ b > 毎个 有界可 积函数都属于 L 2 , 因为 | tx | < M 蘊含 M 2 < M \ n \. 这个陈述 
对无界函数不成立，因为 ari 在上可积，但不平方可积. ► 

两个函数 的内权 ( ti ， u ) 定义为 

r +°° , _ — 、 

( u , v )= I u ( a :) t >( a :) da ;. (7.2) 

它对 L 2 中每一对函数都存在，因为根据施瓦兹不等式 

J |« w|di ^ || u || - || v ||. (7.3) 

特别 («,«) = IH | a . 利用内积的这种定义， \ 2 就变成了 一个希尔伯特空间. 内积 
(7.2) 与两个期望为0的随机变童的协方差的相似性是很明显的，我们以后将利用 
这一点 • 

在作了这些准备之后，我们转向我们的主要目标，即定义形如 

«(0 = ^ J «( x ) e i <; r da : (7.4) 

的变换.当 u 是一个概率密度时，6与特征函数只差一个因子 报 为了避免混淆， 
把6称为 u 的普 朗谢當 变换. 定义 (7.4) 只适用于可积函数 tt , 但我们将把它扩张 
到整个 ZA 下例可以帮 助我们容易理解这种手续以及广义变换的性质. 

①处处收敛于极限 v, 并不籯含 u„ 见 4.2 节例 （e)l. 但如果巳知 u u„ 也存在，那 

么 u = u. 事实上，根据法图引理， 

J | u (*) — «(*)| a dx ^ lim J | u ( x ) — Un ( x)\ 3 dx — 0. 
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例（<0 L 2 中任一函数 u 在有限区间上是可积的，从而我们可以定义截尾变换 
6⑻ ( C ) =-士神办也 

注意，是函数 u ( n ) 的普朗谢雷变换，此函数是这样定 义的： 当 ㈣ < n 时， 

⑻= u ( x ), 当 | ar | > n 时， «(")(*) = 0. 当》 oo 时，对于任一特殊值 C ,« (n) (0 
都不一定收敛，但是我们将证明 {6< n ) } 是一个柯西序列，从而存在 L 2 中的元索 
使得 ii 我们将定义这个 H 为 u 的普朗谢雷变换，显然 (7.4) 中的积分 

不一定收敛.截尾的特殊方式不起作用，取平•均收敛于《的任一其他可积函数序列 
u <") 都得到同一 6. 

例 （ d ) 如果 u 表示二 I ：! 上的均匀密度，那 么它的 普朗谢雷变换 6 = sinx /( xv /2 S ) 
是不可积的.但是厲于 L 2 , 我们将看到它的普朗谢雷变换和原来的密度 w 重合. 
这样我们就把 15.3 节 (3.5) 傅里叶反演公式推广到了特征函数为不可积的密度上 
了. ► 

我们着手来定义一般的普朗谢笛变换.对任一可积函数变换6由 （7.4) 定 
义. 这样的6是连续的（根据控制收敛原理)，且间< ^ 广 | u | di . 一般说来，6 
是不可积的_为了简单起见，我们约定称函数 u 为 “好的”， ^果它是有界连续的， 
且6和 u 都是可积的.于是6也是好的， u 和 ii 都厲于 L 2 [见例 （ b )]. 

首先我们证明反演公式 

«(<) = -^= 乂： tiCOe -'^ dC , (7.5) 

对好的函数成立.我们重述证明 15.3 节中的反演公式时所用的 论证. 用 
(1/ V 5 S ) e - W - iM 乘以 （7.4) 并积分，得到 

(7 . 6) 

其中 n 表示标准正态 密度. 当 e — 0时，左边的积分趋于 (7.5) 中的积分，而右边 
的卷积趋于 u ⑷.因此， (7.5) 对好的函数成立. 

设 u 是另一好的函数.用共轭函数 U ⑷乘以 (7.5), 在 -oo < t < oo 上积分.左 
边等于内积交换积分次序后，右边化为 ( u , t ». 因此，好的函数满足恒等式 

(6,6) = («, v ), (7.7) 

此式称为 L 2 的帕塞瓦尔关系式. 对于 v = u , 它化为 


INI = INI- 


(7.8) 
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由此推出两个变换6和的距离与《和《之间的矩离相同.我们把这点说成：在 
好的函数中，普朗谢雷变换是一个等距变换. 

其次我们证明，关系式 （7.7) 和 (7.8) 对属于 L 2 的任意可积函数 u 和 u 也成 
立. 变换不一定是可积的，但 (7.8) 蕴含它们属于 I 2 [比较例子 （ a ) 和 （ b )]. 

首先我们注意到，具有两个可积导数的可积函数出一定是好的函数.实际上， 
从 15.4 节的引理4我们知道，当 (:— ± oo 时，|*(01 = o ( C ~ 2 ), 因此访一定是可积 
的. 

现在假设 u 是有界可积的（从而属于 L 2 )_ 根据 4.2 节的平均逼近定理，可以 
找出一列好的函数使得 



如果 | U | < M ，那么可以这样选取，使得也有 | u „| < M .于是 u „ 平均收敛于 
u , 因为||« - u „|| 2 不能大于 (7.9) 中的积分的 2 M 倍. 因此，好的函数的等距性 
(7.8) 保证 { u n } 是一个柯西 序列. 另一方面，对于每个固定的- 6(0, 因 
为 | u (0- Un (0 l 不能大于 (7.9) 中的积分.但是，正如本节第1个脚注所指出的那 
样，柯西序列的元索的处处收敛保证序列本身的收敛，因此我们有 


it = l . i . m . u n - (7.10) 

把 (7.7) 应用于对偶和并令 n — oo , 我们看到，当 u 有界可积，而 t ； 是好函 
数时， (7.7) 仍 成立. 再取一次这样的极限，可以证明 (7.7) 对任何一对有界可积函 
数也成立. 

剩下的是证明 (7.7) 对无界函数 u 和 r 也成立，只要它们是可积的且厲于 L 2 . 
为了证明这一点，我们重复前面的论证，但有一个改变，即逼近函数现在是利 
用截尾 定义： 如果 | u (®)| < n , 那么 UnOc ) = U (®). 对于所有其他的 X ,« n (*) = 0.于 
是 (7.10) 成立，并且证明不需要做其他的改变就可应用. 

我们现在可以进行最后一步了，即把普朗谢雷变换的定义推广到整个 L 2 上. 
正如在例 （ c ) 中所看到的那样， L 2 中的每个函数是一个由 L 2 中可积函数 u „ 组成 
的柯西序列的极限.我们刚才证明了， (7.4) 定义的变换 心形成 一个柯西序列，我 
们现在把6定义为这个柯西序列的 极限. 因为两个柯西序列可以结合成一个序列， 
所以极限6与近似序列 { u n } 的选择无关.而且，如果 u 是可积的，那么我们可对 
所有的71取 u „ = «，于是可以看出，当 u 可积时，新的定义和 (7.4) 一致. 可以总 
结如下《 

普朗谢雷变换 6 对 I 2 中的每个 u 都有 定义； 对于可积的 u , 它由 （7.4) 给出， 
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一般说来是由下述法则给 出的： 

如果 m = l . i . m . Un , 那么6 = l . i . m .& n . (7.11) 

帕塞瓦尔关系式 (7.7) 和等距性 (7.8) 对一般情形也成立.映射 u 6是一一的， u 
的变换由 u (- x ) 给出. 

上一断言是傅里叶反演公式 (7.5) 的一个变形，在 u 或6不可积时可以应用 
它，因此 （7.4) 和 (7.5) 中的积分不是在普通意义上定义的.在原来的函数和它们的 
变换之间的关系中的完全对称性是希尔伯特空间中傅里叶理论的主要优点. 

上述理论被广泛地应用于预报理论.作为概率应用的一个例子，我们叙述一个 
通常归功于 A . 辛钦的准则，虽然它出现在 N . 维纳的经典著作中.由于历史传统的 
原因，即使较新的教科书也未能注意到它实际上只是帕塞瓦尔公式的一个特殊情 
形，不需要复杂的证明. 

维纳-辛钦准则 为使函數#是一个概牟密度/的特征函數，当且仅当存在这样 
的函數 u, 使得 ||u|| 2 = 1, i 

^( A ) = J u ( z ) tt(x + A ) dx . (7.12) 


在这种情形下， / = 

证对于固定的 A , 令 《(*) = u(:r + A >. 于是 6( C ) = u ( C ) c - iA <. 帕塞瓦尔关系式 
(7.7) 化成 

f |«(®)| 2 e iAx di = f u(i)u(i + A ) di , (7.13) 

J —oo J —oo 

因为||6|| 2 = 1,所以左边是一个概率密度的特征函数.反之，给定一个概率密度/, 
可以选出一个使得/ =问 2 ,于是 (7.12) 成立_ u 的选择不是唯 一的. （预报理论 
中的一个问题讨论选取在-条射线上等于0的 U 的可能性 .） ► 

傅里叶积分的 L 2 理论可以搬到傅里叶级数上去.现在函数是定义在圆周上的， 
但是对于傅里叶（或普朗谢雷）变换，有相应的傅里叶系数序列.除了这个形式上的 
差别外，两个理论是平行的，只要作简单扼要的说明就够了. 

对于我们的 L 2 , 现在有一个由圆周上平方可积函数组成的希尔伯特空间 
L 2 (- n , n ) 与之对应.于是范数和内积可定义为 


IHI 2 = 

1 

f |u(x)| 2 cLc, 

(u，v) = 


r * - 

—a 
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积分区域是整个圆周（把点 - Ji 和视为一 点). 下列形式的有限三角多项式起着 
“好的函数”的 作用： 

u ( x ) = Y l ^ inx ^ (7.15) 

它的傅里叶系数为 

= — / u ( i ) e - in * da :. (7.16) 

对一个好的函数，有其系数组成的有限序列 M 与之对应.反之，对于毎个有 
限复数序列，有一个好的函数与之 对应. 关系式 （7.16) 和 (7.15) 定义傅里叶变换 
u = {«„} 及其逆变换.形式上的乘积和积分表明，对于两个好的函数， 

^ J u ( x ) v ( x)dx = 52 u * tJ *. (7.17) 

我们现在考虑由无穷序列= { Un },{> = {«„} 等组成的希尔伯特空间力，其范数和 
内积定义为 

INI 2 = = (7.18) 

这个空间与 L 2 有类似的性质.=别=有限序列在整个空间中是稠密的.由此推出， 
在为中的序列6 = { u „} 与 L 2 (- 11 , n ) 的函数 u 之间存在一个一一 对应. 对于每个 
使 El « n| a <0°的序列 {« n }. 存在一个傅里叶系數为 U „ 的平方可积函數与之对 
应，反之 亦然. 映射仍是一个等 $变换，帕塞瓦尔关系式 (1 i ， t 0 = ( fi ， i )) 
成立.傅里叶级数不一定收敛，但由部分和 t ^ e ikx 形成的连续函数列按 L 2 度贵 

收敛于 tt . 同样的陈述对其他连续逼近也 成立. 因此，当 f — 1时， 趋 
于 U . 

如上所述，我们考虑由 

^ J u ( x ) v ( x ) e~ inx dx = ^2^ k+nVk (7.19) 

表示的帕塞瓦尔关系式的特殊情形.取 W = U , 我们又看到， 序列 {#„} 是上 
一个概年密度的傅里叶系数，当且仅当它具有如下 形式： 

+ V»n = y ^. Uk + nUk , 其中 l u * l 2 = !■ (7.20) 

这种形式的协方差曾出现在 3.7 节 （7.4) 中（也见习题 I 7 . ) 
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19.8 随机过程与随机积分 


为了记号简单起见，在本节中我们讨论随机变童序列 { X „}, 但是很明显，这里 
的叙述也适用连续时间参数的随机变 M 族，所不同的只是谱测度不局限于有限区 
间，且级数被积分代替. 

设 { x n } 是定义丁-某一概率空间6且有有限二阶矩的二重无限随机变 M 序列， 
假设序列是严格平稳的，即 

E(X n+v X v ) = p n 

与1/ 无关. 根据 19.6 节定理3,在圆周上存在唯一的一个测度 ft , 使得 

Pn = -^f e - in * fl { dx }, n = 0,± l ,- -. (8.1) 

我们现在来详细叙述 19.3 节所提到的那个想法， 具有错測度 fl 的圓周可以用来构 
造随机过程 {X n } 的一个具体表达式 (至少对于所有只依赖于二阶矩的性质).叙述 
利用了希尔伯特空间的术语，我们将考虑两个希尔伯特空间. 

( a ) 空间 通过逐宇重复 19.7 节中 L 2 的定义 （所 不同的只是在这里要把直 
线换成圆周把勒贝格测度换为测度凡)，我们可以构造一个 圆周上 的函数 
空间.圆周上（复值）函数的范数和内积可以分别定义为 

INI 2 ~ ⑻ | 2 fl { dx }, ( u , v ) = ^J (8.2) 

现在基本的约定是， 如果 两个* 教只在一个 i ? 測度为 0 的集合上不同，那么这两 
个兩数被看作是恒 等的. 这个约定的效果 很大. 如果 集中 于两点0和1上，那 
么“函数”（在我们的意义下）被它在这两点上的值完全确定.例如， smnnx 是零函 
数. 即使在这样极端的情形下，利用通常的连续函数的公式以及参考它们的图形也 
是无 害的. 因此，引用 ■■阶 梯函数”总有意义，并且简化了语言. 

希尔伯特空间是由圓周上所有具有有垠范教的*數组成的，如果 || u „- 
— 0,那么称序列 { Un } 依我们的度 M 收敛于《(或者关于质量分布 ii 均方收敛 
于 《). 希尔伯特空间是一个完备度量空间，连续函数在其中是稠密的.（关于定 
义，见 19.7 节 •） 

( b ) 由 {X n } 张成的希尔伯特空间为 •用为0表示定义在任一固定的样本空间 
上的具有有限二阶矩的随机变童所成的族.根据施瓦兹不等式， E(UV) 对任意一对 
这样的变童都存在，利用基本概率测度代替丑，把 (8.2) 从圆周推广到样本空间6 
是很自然的.因此，我们又约定把两个只在一概率为0的集合上不同的随机变童视 
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为相同的，并且 E (£/ F ) 定义内积 •, 1/的范数是 E ( t / F ) 的 正根. 利用这些约定，巧0 
也是一个希尔伯特空间；它是一个完备度量空间，称随机变 量仏的 序列在其中收 
敛于 t /, 如果 E (队 —0. 

在讨论序列{义„}时，我们通常只对这样的随机变董感兴趣，这些变董是 Xfc 
的函数，在许多方面我们只考虑线性函数.这把讨论局限于有限线性组合 
和这种有限线性组合的序列的极限.这种类型的随机变童构成 So 的一个子空间 
称为由 X fc 张成的希尔伯特空间. 其中的内积、范数和收敛完全像上面那样定义 ，为 
是一个完备度董空间. 

现在期望 EpT „) —点也不起作用，但是因为“协方差"似乎比 ■■内 积”好听， 
所以我们引入通常的约定 E ( X „) = 0. 这个约定的唯一目的是把如当作协方差， 
如果我们约定称 E ( XF ) 为 X 和 y 的协方差，那么就不需要中心常数了.我们现在 
到达了一个关键的地方，即直观上很简单的空间2^可作为《的具体模型.实际上， 
根据定义，任意一对变董的协方差 Pj-k = cov(Xj,X k ) 等于砝中两个函数和 
e lfcl 的内积.由此推出，两个有限线性组合 U 和 V = 的协方差 

等于相应的线性组合 u = 和 v 的内积.根据这两个空间中收敛 

的定义，可以把这个映射推广到所有的变堆上去.因此，我们有一个重要的结果> 
映射 h 在《中的随机变量与 的* 數之间导出一个一一对应，这个 
对应保持内积和范數(从而保持极限) 不变. 利用专门的术语来说，就是这两个空间 
是等距的 .® 我们现在研究和 { X „} 时，可以只明显涉及具体空间 1^. 这个程序 
除了可以帮助直观理解外，还具有理论上的 优点. 因为圆周上的函数是常见的研究 
对象，所以比较容易发现中具有所需要的谱性质的函数序列 {«(">}. 对于 u ("), 
在原来的样本空间 6 中有一个随机变 M Z„ 与之 对应； 如果 ti< n) 的傅里叶系数是 
已知的，那么可以把明显地表示为变量 X * 的有限线性组合的极限.如果& 
的联合分布是正态的，那么的联合分布也是正态的. 

实际上这个程序通常可以倒转过来.给定一个复杂的过程{ X *},我们的目的 
是用一个简单过程的变 M Z „ 表示它.达到这个目的的实际方法是在2^中进行， 
而不是在原来的空间中进行•用一些例子比理论的论述更能说明这一点. 


熟悉希尔伯特空间理论的读者应注意 a 与酉算子的标准*定理的关系.把为以 - 欠„ +1 的 
方式映射到自身的线性算子称为转移算子，可以作为这样一种模 a , 使得在其中这个转移算子 
的运算变成用 e - 11 相乘.反之.在#尔伯特空间为 0 中给定任一西算子 r 和任一元索 x 0 e fio , 
则可以把元索= T'Xo 的序列看作平 稳序列 •把: r 看作由这个序列生成的子空间为上的转 
移算子.如果入0可以这样选取.使得为=« 0 ,那么我们就得到了 r 的标准谱定理（所不同的是， 
我们有一个以的选择为基础的•恒等式分解 ■ 的具体表达 式). 如果 c 为 0 ,那么« 0 是两个 
不变子空间的直和，上述说明适用于这两个子空间的毎一个.利用记 号的* 单改变，我们就可推导 
出一般的谱表达式（包括着的相重性理论 •） 
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例 （ a ) 用独立变量表示 { X n } 的表达式. 和在别处一样，在本节中 { X „} 表示一 
个给定的过程，它的协方差为如，谱测度 ii 由 (8.1) 所定义.在我们的映射中， 
对应于圆周上的函数 e in *. 我们现在证明，对于某些函数 h 对应于 e in */7( aO 的 
随机变董是不相关的.我们只考虑谱测度 H 有一个普通密度 r 的情形.为了简单起 
见*我们假设 r 是严格正的且连续的.选择这样一个函数％使得 


|7 ⑷卩 = r(i). 


(8-3) 


正如在 19.7 节所说明的那样，7的傅里叶级数依 i 2 范数收敛.用 > 表示7的傅 
里叶系数，我们有1：|7*| 2 < ~.根据帕塞瓦尔关系式 (7.20), 

+00 

A>n = 5 Z 7 fc + n 7 fc - (8.4) 

现在考虑由下式定义的函数 u ( n ) 的二重无穷序列， 

u(n) ( x ) = ( 8 . 5 ) 

代入 (8.2), 可见对于 m 7 ^ n , 

||u (n) || = 1, (u (n) ,u (m ))=0. (8.6) 

对相应于函数 u ( n ) 的随机变 S Z „, 这蕴含它们是不相关的，且方差为 1. 特别地， 
如果是正态的，那么厶是相互独立的 • 

有趣的是，变 M X * 张成的空间包含一个不相关的平稳序列用 X * 表示 
的明显表达式可以从函数 tx ( n ) 的傅里叶展开式获得，但是朝相反方向进行是更 
有益的：因为 { Z n } 的构造比 { X k } 的构造简单，所以最好利用来表示 X fc .现 
在有 

^ pifc * " 

E ^ < n + k ) ( x ) = E 7 ne in *. (8.7) 

n=-N f n=-N 

右边的和是 7 的傅里叶级数的一部分，它依希尔伯特空间度量趋于 7. 由此推出擞 
(8.7) 趋于在我们的映射中， U < n + fc ) 对应于 Z n + k , 从而级数 E ^ n + fc 收敛， 
我们可以记 

+0O 

Xk = y^^n^n+fc. (8.8) 


® 除了为避免对当 r(*> = -r(*) = 0时 r ( x ) Mx ) 表示什么以及级败怎样收敛作不足道的说明外， 
用不到这个约束. 
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因此，我们得到了 一个把 & 表示为由不相关变量 為 组成的平德序列中的“移动 
平均”的显式表达式. 

表达式 (8.8) 显然不是唯一的.一个很自然的问 题是： 是不是可以只用变量 
…(表示“过去”）表示 X *,即是不是可以在 (8.3) 中选取这样的 
v 、 使得对《 > 1,6 = 0?这个问题是预报理论中的一个基本问题，但是已超出本 
卷书的范围.关于典型的例子，见 3.7 节 (7.5) 和习题 18. 

例 （ b ) 具有不相关增量的相伴 过程. 对于满足 -n < t < n 的每个 t , 把讲 定义 
为 

Vt(x) = { X ^ t， ㈣ 

10 ， x>t. 

用表示力中的相应随机变童.对于不相交的区间来说，增贵 y ,- y , 的协方差 
显然为0,而且 Var ( r t ) = 于是 { V t } 是一 个具有不相关增量且方差由 H 

给出的过程. 如果是正态的，那么过程的增董实际上是独立的. 

对于每个平稳序列 { x fc }, 都有一个由上述方式得到的具有不相关增量的相伴 
过程与之对应.把 (8.9) 中函数展开为傅里叶级数，就可以用标准方法得到用 
x k 表示的明显表达式.再一次说明朝相反的方向上进行更有益.下例就是这样 
做的. 

例 （ c > 随机积分.（正如我们所见的那样）用表示一个随机变撤1/的表达式依 
赖于相应于 U 的函数的傅里叶展开式.相反，用变童 Vi 表示的下述表达式似乎太 
简单了.它涉及到了函数的图形.为简单起见，我们假设函数是连续的. 

首先考虑一个阶梯函数即一个形如 

w = atVt , + aiivt , - Vu ) + ••• + a n ( y „ - y tn _,) (8.10) 

的函数，其中巧是常数，相伴随机变世 W 可以在 
这个表达式中把每个 yu 换成而得到.任一连续函数比都可以利用形如 (8.10) 
的阶梯函数—致地逼近 .《»( n) —致收敛于 级含依 L 2 r 的范数收敛，从而也 
组含相应的随机变逋收敛于这给我们提供了一个通过简单的极限手续 
求任一连续函数的像 W 的 方法： 用形如 (8.10) 的阶梯函数通近并把 y ti 换 
为记住 (8.10) 是一个函数，而不是一个数，正如 《; ( n ) 的极限 w 是一个函数而 
不是一个数 一样. 但是 （8.10) 看上去像 一个黎曼和，我们的程序在形式上使人想起 
黎曼积分的 定义. 因此，它成为标准的作法，人们通常用记号 

W = J u ;( t)dVi (8.11) 

表示上述极限过程.随机变 M (8.11) 称为连续函数《;的随机积分.这个名称是任意 
的，这个记号只是我们已严格定义的极限手续的一个简写形式.由定义，函数 e int 
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对应于随机变董 X „, 从而我们可以记 

X n = J K e int dy t . (8.12) 

这就是用具有不相关增量的相伴过程表示任意一个平穗序列 {^ n } 的错表达式 • 

与其说随机积分的记号具有逻辑性，倒不如说它具有启发性，但是我们不讨论 
这种 用法. 我们的目的是要证明，这个有用的概念和重要的表达式 （8.12) 可以通过 
傅里叶分析的办法建立起来.这就说明了本节所用的首先由克拉美引进的典型映 
射的威力. ► 

这个理论只依赖于 {X n } 的二阶矩，并且实际上只有在这些矩真正有意义时 
才能应用.当过程是正态过程时，情况就是 这样. 因为正态分布被它们的协方差完 
全确定.在其他的应用中，我们可以相信过程••与一个正态过程差别不太大”，正 
如在最古老的回归分析中人们相信对正态变读发展起来的方法是普遍可用的一样. 
遗憾的姮，仅仅存在一个优美的理论绝不能说明这种相信是有理由的.在 19.3 节例 
( c ) 中过程的样本函数是严格周期 函数. 各条轨道的未来被一个整周期的数据完全 
确定，但是以 L 2 理论为基础的预报理论不考虑这个事实，它把所有的过程和同一 
谱测度等同.一个对无穷序列1, -1, 1, -1, ■ ••作了长时间的观察的人可以可靠地 
预报下一个观察值，但是 L 2 方法使他预报到0的奇迹般的出现.这个例子说明 L 2 
方法不是普通可用的，但它是讨论正态过程的理想工具. 

19.9 习 题 

1. 奇特的 特征* 數.对/ I 设 Tk (*) = 1 - \ x \/ h , 对 1*1 彡 A 设 7 X (*) = 0•令 

a (*) = 53 OnTk(x - n ). (9.1) 

当 On 是实数 ，/I = 1时， a 的困形是一个«点为 （ n , a „) 的折浅.当/»< ^时， a 的图 
形由; r 轴上的小段和顶点为 ( n , o „) 的等應三角形的隳所组成. 

利用 19.2 节引理1的准则证明 I 如果 a „ 是实数，且 a _„ = a „，| a 1 | + | aa | + ...< 
| ao , 那么 a «)/ a (0) 是一 i ' 特征函数. 

2. (推广)当把 n 换为任意一个偶可积特征函数时，上题的陈述仍然成立.（利用 15.2 节 
的图1所表示的特征函数，您可以构造一个具有非常离奇的折线图形的特征函数 .） 

3. ( 续）上述结果是下列结果的特殊情形，设 r 是一个偶可积特征函败，如果 A „ 是实 
数 ，知 是满足 EM < oo 的复常数，那么为使 

a ( C ) = 52 afcT ^ -Afc ) 


(9-2) 
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是一 个特征函数，当且仅当 a ⑼=1,且对于所有的 C ， Ea * e - 1Xh < > 0. (实际上，只 
要上一级数是阿贝尔可和的，且和为一个正函数就行了 

4. 为使 （3.3) 中所定义的协方差函数 p 是处处连续的，当且仅当它在原点连续.为使情 
况是这样的，当且仅当 t — 0时 E ( X t - Xo ) 3 - 0. 

5. (差商与导數).设{ X ,}是一个平稳过程， p ( t ) = E ( X t + . T t ) 且谱测度为兄对于 
/» > 0,用 Xi h) = ( X t+h - Xt )/ h . 定义一个新过程. 

( a ) 证明： 新过程的谱测度^ (/1) 为 fl w { da ：} = 2 ft- a [l - cosfc ®] fl { dx }. 为使当 
h -*0 时协方差 p ^ h \ t ) 趋于一个极限，当且仅当存在连续的二阶导数 〆 '(*),即测度 
x 3 fl { d ®} 是有限的. 

( b ) 在后一情形下，当 e — 0, 6 — 0时， E (| X t (<) - X t w 卩 ）— 0. 

注利用 19.7 节希尔伯特空间的术语，这就是说，对于固定的 t , 当 — 0时，序列 
{^* n ) } 是一个柯西序列，从而导数 XI = U . m . X ^ 存在. 

6•(见 19.4 节定攻 2) 如果除了在原点具有跳跃以外 ， #是连续的，那么在原点的一个邻 
域外一致的有 M 0 — < p (0, 并且 A ⑼ — ^(0+) - ^(0-)]. 

7. ( 味）如果^ 是两个单调函数之差，那么在所有的点上， / r ( C )- || v >«+)~ V «-)]. 

8. 具有非负傅里叶 系数％ 的有界周期函败# 一定是连续的，且！>„ < oo •外== l / r » 
这个例子表明，如果只假设 P 可积，那么这个结论是错误的.提示，利用 19.4 节定理 
1的证明的主要思想. 

9. 切萨罗 （ Cesaro ) 可和性 •把 (4.3) 换为 

/r(0 = [ ifin<lne in< ' , 

其中对于 | n | (2 N,On = l -| n |(2 JV + l)-S 对于 | n | >2 N , On = 0. 证明.如果把 P r ( t ) 
换成 

^ sin 2 

gN ( t )= wn — 

(这也是一个概率密度)，那么 19.4 节的理论也成立. 

10. ( 续）更一般地 证明： 如果 a „ 是圆周上一个对称化了的概率密度的傅里叶系数，那么 
19.4 节的理论也成立. 

11. 利用泊松求和公式 (5.2) 来证明 ■ 

£{"(^^) + " )} 

1 ( 1 2J * 2 、 nn rm 

= A 5^(-2^ ^ J «* Ta ： co 8 T „, 

其中 n 表示标准正态密度.[这是 10.5 节例 （ c ) 中反射壁问题的解 . 】 


㈣ ‘ 
~ T1 ’ 
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12. 在泊松求扣公式 （5.2) 中 ，5>( C +2 fcA ) 收敛于连续函数 矽这个 条件可以换为 
A )< oo . 提示：矽在任何情形下都是可积 函数. 利用 19.4 节系 2. 

13. 泊松求和公式的另一种推导.设 p 是任意一个概率分布 f 的特征函数.如果朽表示 
(4.5) 和 (4.7) 中的泊松核，证明（无需进巧的计算)：对于0 < r < 1, 

忐2 ^C + ^ r '-' e ^ = J + \^ P r {x + X ) F { dx }. (9.3) 

因此，左边是一个特征函数.令 r — 1,证明 ：如果 F 具有-个密度/,那么当 
/(—A + 2 kn ) < oo 时， 

¥>(C + n ) e ,nX = £ e ic( - A+2fa,) /(-A + 2 feJi ). (9.4) 

证明= (9.4) 等价于求和公式的一般形式 (5.9). 

注这个结果可以重新叙述为，当 (9.4) 的右边连续时，左边是阿 W 尔可和的，且和为 
右边. 

14. 为使序列是正定的，当且仅当对于每个 0< r < l , 是正 定的. 充要条件 
是对于所有的 A 和0 < r < l ， Ev > ne lnA > 0. 

15. 由习题1和习題 M ( 无需计算）推导下述（由 L . 谢柏发现的）定理；设 { v »„} 是正定的， 
用 a 表示顶点为 ( n ,^) 的分段线性函数，那么 a 是正定的. 

16. 设是一个 特征* 敷，用 a 表示顶点为 ( n , V ( n )) 的分段綫线性*數，邯么 a 是一个 
特征 A 數.（这 只是重 新叙述了习题15,并且是习埋1当 A = 1时的特殊情形 .） 利用 
习题1的其他情形来推述可由 W 得到的其他奇特的特征函数. 

17. 如果 I " < 1, 那么马 尔可夫序列的协方差/»„= r '" le lntf 满足具有下列的 (7.20), Jfc > 0 
时，灿= vT ^ r * e 1M , fc < 0时，叫= 0. 求另一表达式. 

18. ( 续）设 { X „} 是-个$方差为 p „ = r '" le '" 9 的马尔可夫序列.如果 》• < 1,那么我 
们有其中厶是不相关的•如果 r = 1,那么我们有 
X n = e ln 9 Z 0 . 





习题解答 
第1章 


1. ( i ) |-^= e -« xi . ( ii ) x >3. 

( iii ) | e - Q l*l 对于所有的 a :, ( iv ) ae -°*, x > 0. 

W«( 1 + 3^l) e — - 4 - 

(如， + !如』 _ 屮 + ! 士 . 

2_ ( i ) | X | < 1. ( ii ) i , l < t <5. 

(出) ！(1- Y ). W <2. ( iv ) 1 - I ，0 < * < 2. 

( v ) | a :| < 1. ( vi ) ^ + iii + 占 ari , |®| < 1. 

3. ( i ) h^il - e~ ax ), 0<x<h, h~ l (e ah - l)e~ ax , x>h. 

( ii ) ^ _1 (1 - e - a < I+fc )), -ft < x < 0, h-\l - e~ ah )e~ ax , x>0. 

4. ⑴ ft /3, A < 1; 1/(3 VS ), ft > 1. ⑼ %/« iei Q ( l - ^(y/a/2)). 

5. ( i ) 1 — a -1 , ® > 1. ( ii ) i 2 (® 4 - 1) -2 . 

7. P{Z ^ i } = 1 — e~ ax , x <t-, P{Z ^ i } = 1, x > t. 

10. ( b ) 车队随汽车一起前进，组成一个样本，其中最小元素位于最后一个位置, 
第2小元索位于最后第2个位置. 

16, P = E 1 ( n + ^ _1 )2-"- fc . 对于 m = l，n = 2, 得 P =l 

18. nt n ~ l - (n _ l )< n . 

19. {: x)lj\xj\l-z)Az = \. 

( ii ) 密度是 2* - P (0 < * < 1) 和 （2 - t) 2 (l < t <2). 

( iii ) 密度是 2 t 2 (0 < t < 1) 和 （2 - t) 2 (l < t < 2). 

20. 2 / ar(l - x)dx = |. 6 个置换中每 2 个都相交. 

JO 

21. Xu ： 41n^, x< j ； X 12 和 X 21 : 4ln2, a; < 1 ， 41n 士 ， $ <® < !; 



超解答 


22 -.4 ln 4 x , i < x < i ,41 iii 期望值是 “ 告 . 

. 布是農 arcsin^i 和 ^i 2 ； 密度是 ^-^===和 ^x,0<x<2. 

28. 2ji -, arcsin^a:. 

30. (a) In 臺 . (b) ^ In ^ ^ ― 0 -, 其中 0 < a; < 1. 

31. — f sin 2 = - f \/\ — y 2 dy 

n Jo<coae<n n JO 

= 2n~ l [arcsini + xy/l~—x^] , 其中 0 < a; < 1. 

32 -叫卜 fjT v (士) (i-co6 _*. 

35. 代换 s = F(y) 把积分化为均勻分布的相应积分 . 注意，对于小的 *, F(m+x) « 
2 + f(m)x. 


第2章 


4. 

10 . 

12 . 

13. 


5 *»(*)= ^-1*1(1+ |x|), 
p 3 *(x) = ie-W(3 + 3|i| + x a ), 

〆*(:) = ^ e_N ( 5 + 5 l a： l + 2a：2 + ^W 3 )- 

(a) 作为2个指数密度的卷积， A M (e- At -e-^)(M-A). 

(b) 利用⑷ 得出 Ae~ w . 

对于随机地到达的人，密度是< * < 1) 和|(2-*) 2 (所有的1 < « < 2). 
期望值等于長. 


-l)(m + n + /i_<-fc-l)/(m + n4' 


第3章 
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8. 如果/有期望值 p 和方差 〆 ，那么 E ( X ) = E(Y) = |/ i , Var ( X ) = Var ( y )= 

ia 2 + ^ 2 , Cov ( X , y ) = ^ 2 -^ 2 . 

9. 在单位正方形内，密度是 2 a : 2 •在 n 个变董时，密度是 ( n - l )! X 2 X |---^ r ?. 

10. i e -(*+»)(y > a : > 0) 和 | e_» +2 *(y > *， i < 0) •当 y < a : 时，把 i 和 y 交换 • 

11 - (»)4^/(*)/0^,0<*<^. ( b ) 

其中 0<; c <|< y < l , 并且积分区域满足条件 2 a : < s < -和1 - < 

s <l-y. 

12. 具有方差 m , n 与协方差的二元正态 密度. 条件密度具有期望值与 
方差 


13. X ? +…+々具有 r 密度[见 2.2 节 (2.2)1. 因此，由 (3.1) 有 

r G) i\ |(n-m)-l; 

f n - m \ vT/ v 1 _ l) 


喵 ) r m 


对于 m = 2，n = 4, 得 3.3 节例 （ a). 


15. (a) 4xy, 

4xy -4(x + y- l) 2 , 
4i(2 -x-y), 
4y(2-x-y), 

(b) 2(1 - * - y) 2 , 

2(1 - x) 2 . 


当 ar +1/ < l，z > 0，i/ > 0 时； 
当; c + y> l,0<a:，y< 1 时； 
当 y > l，a: + y < 2，i > 0 时； 
当 a: > l，z + y < 2，y > 0 时. 
对于 0 < ®，y < l，;c + i/ < 1， 
对于 a: > 0, y < 0, ® + y > 0. 


2(1 + J/) 2 , 对于 a: > 0，y < 0，a: + y < 0. 

对于 * < 0 的 情况，可 由对称性得出. 

16. 2 去 

17. f f(p)pdp f g( y/r 2 + p 2 - 2rp cos 6)A6. 

Jo Jo 

20. (a) X n = U cos ^nn + V sin (b) U + V(—l) n . 

(c) U cos + K sin ijin + W. 

21. (a) Var(r„ +1 ) - Var(r n ) = Var(C„) - 2Cov(y n ,C„) + 1, 
(b) a 2 — 2a<rp +1 = 0, 



586 习題解答 


(c)<7 = i(a+i), y„ = X) ^Xn-i-k + q n Yo + (6p-o)(l- q n )/p, 

z \ a/ fc =0 

其中 g = 1 - p . 

22. <t 2 ^ + —^ + N. 


第 6 章 


11. 不一定.但是一定有 n【l - F(e n)l -» 0. 

12. 对于 x>0, 密度是1和 $(1 - e- 2 *). 

13. qU ( x ) = 1 - qe ~^. 更新时刻的个数总是几何分布的. 

19. Z = z-¥F-kZ, 其中，当 * 彡《时 2 ：⑷=1 - e rt , 当 t > 5时 z ( t ) = z (0, 当 
t > { 时 F(t) = e -°« - c - 6 *. 


20. V = A + BirV , 其中 A{dx) = [1 - G(x)]F{d®}. B{dx] = G(x)F{dx}. 
23 - 臓密度 


第 7 章 


6. 


(a) — p )"—* 1 , 并且 F 集中在 p 上 . 

(b) ^ ，密度 / ⑷ =i. 


(c) 


2(fc + l) 

(n + l)(n + 2) 


, 密度 2ar. 
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